Posudek MBA práce DABM
Název: Analýza výroby automobilů: vliv konfigurace na délku výroby Autor: Ing. Jakub Vancl
Mentor práce: Ing. Pavel Zimmermann, Ph.D.
Oponent práce: Mgr. Michal Gerthofer, Ph.D.
Hodnocení MBA práce
Následující tabulka zobrazuje jednotlivá hodnoticí hlediska. U každého z nich vyberte známku (zaškrtnutí křížkem), kterou si přejete udělit. Možné hodnoty jsou 1 výborně, 2 velmi dobře, 3 dobře, 4 nevyhověl(a).
Poř. Hlediska Stupeň hodnocení
1 2 3 4
1. Jasnost a srozumitelnost formulace tématu a cíle práce x 2. Popis a relevance řešeného business problému x
3. Náročnost tématu práce z pohledu business řešení x
4. Náročnost tématu práce z pohledu datové analýzy x
5. Rozsah, hloubka a preciznost řešení x
6. Propojení business a datové části řešení x
7. Business přínos výsledku dosaženého v práci x
8. Logická stavba práce a vzájemná konzistence jednotlivých částí x
9. Gramatika, jazykový styl, terminologie a celková úprava práce x Připomínky a otázky k závěrečné práci
Práca sa zaoberá business problémom v automobilovom priemysle, kde sa aplikácia dátovej analýzy a machine learning metód javí ako relevantná a prínosná. Autor jasne formuluje cieľ svojej práce a zrozumiteľne popisuje ako business problém a prostredie tak požiadavky na riešenie z pohľadu expertov.
Práca je členená logickým spôsobom a po grafickej stránke je na slušnej úrovni. Po formálnej stránke je v práci viacero nepresností (najmä vety začínajúce malým písmenom, napr. str. 15, str. 30) a gramaticky nesprávnych viet (napr. „Hlavní myšlenkou process miningu je objevovat, monitorovat a zlepšovat reálné procesy tím, analyzuje informace z logů…“ str.35). Väčšina práce sa venuje popisu dátových zdrojov, ich manipulácii a transformáciám (sekcia 3.1 a 3.2). Napriek detailnému slovnému popisu zdrojových dát v kapitole 2, v práci chýba analýza dátovej kvality týchto zdrojov (prehľad počtu pozorovaní, chýbajúcich hodnôt, popisných štatistík atď.). V kapitole 1 (str. 8) autor uvádza, že na analýzu budú exportované dáta za obdobie 1 roka. Ďalej autor uvádza v kapitole 2 (str. 9), že v databáze sú k dispozícii dáta za posledných 365 dní, avšak extrahované dátové súbory pokrývajú len obdobie 11 mesiacov (1.8.2019-30.6.2020), čo autor bližšie nezdôvodňuje. Sekcia 3.5 predstavujúca machine learningové metódy použité na riešenie problému by si zaslúžila viac pozornosti a detailnejšie vysvetlenie jednotlivých metód. Sekcia 3.6 obsahuje stručný prehľad dosiahnutej kvality výsledných modelov pre jednotlivé fázy výrobného procesu a celkovú výrobu spolu s identifikovanými PR podmienkami, ktoré signifikantne ovplyvňujú dĺžku výroby. V časti prezentujúcej výsledky modelov pre lakovňu (str. 48) sa autorov popis modelu s najvyššou presnosťou (regresný náhodný les s parametrami Custom a medián) nezhoduje s výsledkami prezentovanými v tabuľke 11 (najvyššia presnosť pre regresný náhodný les s parametrami Unique a vlastná hranica). V závere práce pri popise identifikovaných kódov PR vlastností, ktoré signifikantne ovplyvňujú dĺžku výroby, chýba interpretácia týchto vlastností. Tu by bolo vhodné lepšie popísanie výsledkov dátovej analýzy z business
stránky. Celkovo práca naplnila svoj cieľ a navrhla riešenie zadaného problému spolu s možnými vylepšeniami.
Otázky:
1. Vysvetlite rozdiel medzi ukazateľmi MAE, MSE a RMSE a ich súvislosť presnosťou modelu.
2. Vysvetlite základné rozdiely medzi klasifikačným a regresným náhodným lesom.
3. Koľko vrstiev ste uvažovali v praktickej implementácii viacvrstvového perceptronu?
Hodnocení shody práce s pracemi jiných autorů (vyplňuje pouze mentor na základě výstupu z antiplagiátorského systému VŠE):
Výsledná klasifikace práce
Vyberte jednu z možností. Možné hodnoty jsou 1 výborně, 2 velmi dobře, 3 dobře, 4 nevyhověl(a).
1 2 3 4
Navrhuji následující výslednou známku: x
Závěr
Vyberte jednu z možností:
Ano Ne
Závěrečnou práci doporučuji k obhajobě: x
Autor posudku: Mgr. Michal Gerthofer, Ph.D.
Datum: 15.2.2021 Podpis: