• Nebyly nalezeny žádné výsledky

Oponentura69852_Píšová.pdf, 51.4 kB Stáhnout

N/A
N/A
Protected

Academic year: 2022

Podíl "Oponentura69852_Píšová.pdf, 51.4 kB Stáhnout"

Copied!
2
0
0

Načítání.... (zobrazit plný text nyní)

Fulltext

(1)

Posudek oponenta diplomové práce

Studijní program:Aplikovaná informatika

Studijní obor:Informační systémy a technologie Akademický rok:2020/2021

Název práce:Řízení datové kvality v Hadoop Ecosystem Řešitel:Bc. Jan Halama

Vedoucí práce:doc. Ing. Jan Pour, CSc.

Oponent:Mgr. Vendula Píšová

Hlediska Stupeň

hodnocení

1. Jasnost a srozumitelnost formulace tématu a cíle práce 1

2. Rozsah a relevance popisu současného poznání 1

3. Náročnost řešeného tématu práce 1

4. Adekvátnost metod k řešení stanoveného problému, správnost jejich výběru a použití 1

5. Rozsah, hloubka a preciznost popisu výsledku 1

6. Relevance a správnost diskuse výsledku 2

7. Věcný přínos výsledku dosaženého v práci 1

8. Relevance informačních zdrojů a korektnost jejich citování 2

9. Logická stavba práce a vzájemná konzistence jednotlivých částí 1 10. Gramatika, jazykový styl, terminologie a celková úprava práce 2

Konkrétní připomínky a dotazy k práci:

Autor v diplomové práci kromě řízení datové kvality a návrhu validačního nástroje podává přehledný úvod do problematiky big data. Navíc podrobně popisuje úlohu jednotlivých typů zaměstnanců zodpovědných za zpracování dat a velmi dobře identifikuje slabá místa v procesu reportingu.

Nástroj pro datové validace a monitoring navržený autorem skutečně pomohl snížit množství manuálních oprav dat a počet chybných reportů. Tím autor splnil hlavní cíl práce vytyčený v jejím úvodu. Na zvoleném řešení oceňuji zejména důraz na uživatelskou přívětitvost nahlášených nedostatků v reportech. Zveřejnění chybových zpráv v nástroji Slack, který je ve zmiňované společnosti používán také pro každodenní komunikaci, výrazně zkracuje reakční čas zodpovědných zaměstnanců.

V teoretická části práce věnované popisu big data a ekosystému Hadoop postrádám jasnější vymezení těchto pojmů vůči datům, procesům a nástrojům, které do oblasti big data nespadají.

V textu se objevují některé drobné gramatické a stylistické chyby. Při používání termínu anglického původu v česky psaném textu, zejména pokud jde o skloňování a zdůraznění velkým počátečním písmenem, se autorovi nepodařilo udržet konzistentní přístup.

K práci mám několik otázek:

• Jaké jsou limity autorem zvolené implementace validačního nástroje? Které typy chyb takovému nástroji mohou uniknout?

• V čem je autorovo řešení specifické pro prostředí big data? Jak by bylo třeba daný nástroj upravit, aby vyhovoval potřebám reportingu běžných dat?

Závěrečnou práci doporučuji k obhajobě.

(2)

Závěr: Diplomovou práci doporučuji k obhajobě.

Navrhovaná výsledná klasifikace práce: 1

Datum: 21. 5. 2021 Mgr. Vendula Píšová

oponent práce

Odkazy

Související dokumenty

Daň ze spotřeby minerálních olejů tvoří největší podíl na celkovém výnosu z daňových příjmů v rámci spotřebních daní. Výnos z této daně plyne do

Autor (Vacek 2014) práce Metriky, monitoring a řídící proces Data Governance přehledně popisuje jednotlivé dimenze datové kvality a také přidává příklady

Zároveň bych ale ocenil hlubší rozpracování problematiky datové kvality a možné dopady datové nekvality v prostředí finanční instituce. Jako témata k diskuzi při

Autor se v posuzované diplomové práci zabývá předcertifikačním auditem dle ISO/IEC 27001 včetně návrhu nástroje pro posouzení úspěšnosti hodnocení požadavků uvedených

Kapitola 4 Implementace řízení datové kvality pomocí datového katalogu popisuje koncept implementace řízení datové kvality, přesněji obchodních pravidel, ve vybraném

Práce vhodně poukazuje na možnosti využití asociačních pravidel a systému LISp-Miner při řešení praktických problémů řízení datové kvality.. Práci lze

Diplomant věnoval pozornost návrhu a vývoji aplikace, která umožňuje zobrazovat a klasifikovat data naměřená v aplikaci I4Tracking.. V úvodu diplomové práce

V diplomové práci jsem porovnával zpracování Big Data formou ETL pomocí nativního nástroje v prost°edí Hadoop MapReduce, Big Data ETL nástroje Talend Open Studio for Big