Posudek oponenta diplomové práce
Studijní program:Kvantitativní metody v ekonomice Studijní obor:Statistika
Akademický rok:2021/2022
Název práce:Alternativní způsoby vizualizace kategoriálních dat ve shlukové analýze Řešitel:Bc. Barbora Kupková
Vedoucí práce:Mgr. Jana Cibulková Oponent:Ing. Zdeněk Šulc, Ph.D.
Hlediska Stupeň
hodnocení
1. Jasnost a srozumitelnost formulace tématu a cíle práce 2
2. Rozsah a relevance popisu současného poznání 3
3. Náročnost řešeného tématu práce 3
4. Adekvátnost metod k řešení stanoveného problému, správnost jejich výběru a použití 3
5. Rozsah, hloubka a preciznost popisu výsledku 4
6. Relevance a správnost diskuse výsledku 4
7. Věcný přínos výsledku dosaženého v práci 3
8. Relevance informačních zdrojů a korektnost jejich citování 1
9. Logická stavba práce a vzájemná konzistence jednotlivých částí 3 10. Gramatika, jazykový styl, terminologie a celková úprava práce 2
Konkrétní připomínky a dotazy k práci:
Autorka se v práci zabývala vizualizačními metodami ve shlukové analýze kategoriálních dat. Téma považuji za relevantní, protože se v současné době kategoriální data a shluky z nich vytvořené jen velmi obtížně znázorňují. Cíl práce, kterým bylo identifikování možností zlepšení vizualizace a navržení nových postupů, se autorce podařilo naplnit. Hlavním výstupem práce je tak přehled vizualizačních technik se svými výhodami a nevýhodami, a především navržení nového grafu, který nazvala cluster scatter plot.
Potenciál celé práce bohužel výrazně snižuje několik závažných nedostatků. Zaprvé, práce nemá logickou strukturu. Autorka se ve většině práce zabývá popisem metod, které pro svůj cíl nepotřebuje, např. popis různých měr vzdáleností pro různé typy proměnných. Naopak, metody vizualizace shluků, tedy hlavní téma práce, jsou probrány velmi povrchně. Zvláště u kapitoly 3.2 zabývající se novými metodami vizualizace bych si dokázal představit jejich podrobnější popis, který by byl pro čtenáře velmi přínosný.
Zadruhé, práce není dostatečně precizní. Autorka téměř abstrahuje od používání vzorců v textu. Všechny vztahy popisuje prostřednictvím vět, ze kterých není mnohdy jasné, jak se věci mají, což je
u představování nové metody vizualizace závažný problém. Srozumitelnosti práce navíc nepřidává nekonzistentní značení v průběhu práce, nevysvětlení použitých pojmů při prvním použití nebo použití výroků, které nejsou odůvodněné ani citované. Také není vhodné, že autorka pojmenovává některé již zavedené názvy měr podobností svými vlastními, čímž může způsobit zmatení čtenářů. Zatřetí, rozsah vlastní práce je velmi malý, necelých 40 stran, což je méně než u mnoha bakalářských prací. Obecně to nemusí být velký problém, ale v tomto konkrétním případě si myslím, že zde byl potenciál na další rozšíření obsahu, který nebyl využit. Jedná se už o již zmiňovanou kapitolu 3.2 nebo o zcela chybějící praktickou část, ve které by autorka mohla ověřit, jak si navržený graf vede v reálných situacích a případně jej porovnat s alternativními metodami vizualizace.
Ocenit naopak musím velmi dobrý jazykový styl práce, práci s citacemi, rozsah literatury a přesah práce v podobě nového grafu, který může pomoci při zobrazování vztahů v kategoriálních datech. Škoda jen, že popisovaný skript není součástí práce.
V případě úspěšné obhajoby doporučuji práci hodnotit jako dobrou.
Otázky k práci
1. V práci tvrdíte, že použití měr určených pro nominální proměnné je vhodnější než jejich transformace
na binární proměnné. Dokládáte to jedním grafem (heatmap) založeným na míře podobnosti Eskin.
Můžete porovnání doplnit i o jiné míry podobnosti z balíčku nomclust?
2. Na straně 42 popisujete postup Vámi představeného grafu, který bohužel není dostatečně precizní.
Můžete tedy způsob, jakým tento graf tvoříte popsat podrobněji? Pokud to bude potřeba, můžete k popisu použít i vztahy ve formě vzorců nebo schémat.
Závěr: Diplomovou práci doporučuji k obhajobě.
Navrhovaná výsledná klasifikace práce: 3
Datum: 20. 1. 2022 Ing. Zdeněk Šulc, Ph.D.
oponent práce