Posudek oponenta diplomové práce
Studijní program:Aplikovaná informatika
Studijní obor:Informační systémy a technologie Akademický rok:2020/2021
Název práce:Řízení datové kvality v Hadoop Ecosystem Řešitel:Bc. Jan Halama
Vedoucí práce:doc. Ing. Jan Pour, CSc.
Oponent:Mgr. Vendula Píšová
Hlediska Stupeň
hodnocení
1. Jasnost a srozumitelnost formulace tématu a cíle práce 1
2. Rozsah a relevance popisu současného poznání 1
3. Náročnost řešeného tématu práce 1
4. Adekvátnost metod k řešení stanoveného problému, správnost jejich výběru a použití 1
5. Rozsah, hloubka a preciznost popisu výsledku 1
6. Relevance a správnost diskuse výsledku 2
7. Věcný přínos výsledku dosaženého v práci 1
8. Relevance informačních zdrojů a korektnost jejich citování 2
9. Logická stavba práce a vzájemná konzistence jednotlivých částí 1 10. Gramatika, jazykový styl, terminologie a celková úprava práce 2
Konkrétní připomínky a dotazy k práci:
Autor v diplomové práci kromě řízení datové kvality a návrhu validačního nástroje podává přehledný úvod do problematiky big data. Navíc podrobně popisuje úlohu jednotlivých typů zaměstnanců zodpovědných za zpracování dat a velmi dobře identifikuje slabá místa v procesu reportingu.
Nástroj pro datové validace a monitoring navržený autorem skutečně pomohl snížit množství manuálních oprav dat a počet chybných reportů. Tím autor splnil hlavní cíl práce vytyčený v jejím úvodu. Na zvoleném řešení oceňuji zejména důraz na uživatelskou přívětitvost nahlášených nedostatků v reportech. Zveřejnění chybových zpráv v nástroji Slack, který je ve zmiňované společnosti používán také pro každodenní komunikaci, výrazně zkracuje reakční čas zodpovědných zaměstnanců.
V teoretická části práce věnované popisu big data a ekosystému Hadoop postrádám jasnější vymezení těchto pojmů vůči datům, procesům a nástrojům, které do oblasti big data nespadají.
V textu se objevují některé drobné gramatické a stylistické chyby. Při používání termínu anglického původu v česky psaném textu, zejména pokud jde o skloňování a zdůraznění velkým počátečním písmenem, se autorovi nepodařilo udržet konzistentní přístup.
K práci mám několik otázek:
• Jaké jsou limity autorem zvolené implementace validačního nástroje? Které typy chyb takovému nástroji mohou uniknout?
• V čem je autorovo řešení specifické pro prostředí big data? Jak by bylo třeba daný nástroj upravit, aby vyhovoval potřebám reportingu běžných dat?
Závěrečnou práci doporučuji k obhajobě.
Závěr: Diplomovou práci doporučuji k obhajobě.
Navrhovaná výsledná klasifikace práce: 1
Datum: 21. 5. 2021 Mgr. Vendula Píšová
oponent práce