• Nebyly nalezeny žádné výsledky

Hlavní práce70191_novp23.pdf, 2.1 MB Stáhnout

N/A
N/A
Protected

Academic year: 2023

Podíl "Hlavní práce70191_novp23.pdf, 2.1 MB Stáhnout"

Copied!
55
0
0

Načítání.... (zobrazit plný text nyní)

Fulltext

(1)

Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky

Analýza Self-service BI v různých prostředích a nástrojích

BAKALÁŘSKÁ PRÁCE

Studijní program: Aplikovaná informatika Studijní obor: Aplikovaná informatika

(2)

Prohlášení

Prohlašuji, že jsem bakalářskou práci Analýza Self-service BI v různých prostředích a nástrojích vypracoval samostatně za použití v práci uvedených pramenů a literatury.

V Praze dne 25. dubna 2020 ...

Pavel Novotný

(3)
(4)

Abstrakt

Tato bakalářská práce se zabývá analýzou self-service business intelligence nástrojů Microsoft Power BI, Tableau a SAP Analytics Cloud v podmínkách implementace úlohy analýzy skladů.

Vzhledem k rostoucímu objemu společnostmi denně zpracovávaných dat je na tuto oblast nástrojů kladen stále větší důraz a výběr vhodného analytického nástroje je kritický pro efektivní podporu rozhodování business uživatelů.

Práce jednak popisuje samotné principy business intelligence, self-service business intelligence, charakterizuje současný trh analytických a BI nástrojů, v dalších částech se pak věnuje návrhu řešení úlohy analýzy skladů formou dimenzionálního a datového modelu. Samotné řešení je implementováno v daných nástrojích, přičemž u každého z nich jsou popsány jeho možnosti a funkcionality z různých hledisek, např. konektivita k datovým zdrojům, možnosti vizualizace dat aj.

Následně tato práce na základě definovaných kritérií jednotlivé nástroje v podmínkách implementované úlohy hodnotí.

Klíčová slova

business intelligence, self-service business intelligence, Power BI, Tableau, SAP Analytics Cloud

JEL klasifikace

M15

(5)

Abstract

This bachelor’s thesis deals with the following self-service business intelligence tools: Microsoft Power BI, Tableau and SAP Analytics Cloud and analyses them under conditions of warehouse analytics. Due to the increasing volume of data that companies process and analyze daily the focus on this field of tools has been growing ever since and the choice of the right analytical tool is critical to provide efficient support in the decision-making process.

This paper describes the principles of business intelligence, self-service business intelligence and outlines the current BI & Analytics market. In later parts, it proposes a solution to an analytical task, which in this case is warehouse analytics. The solution is implemented in a form of a dashboard in each of the mentioned SSBI tools with the focus on each’s functionality and options analyzed from various perspectives, such as data connectivity, data visualization options etc. Finally, each tool is rated based on the observations obtained during the implementation phase.

Keywords

business intelligence, self-service business intelligence, Power BI, Tableau, SAP Analytics Cloud

JEL Classification

M15

(6)

Obsah

Úvod ...12

Vymezení tématu práce a důvod výběru tématu ...12

Cíle práce ...13

Předpoklady a omezení práce ...13

Struktura práce ...13

1 Rešerše vybraných zdrojů ...14

1.1 Rešerše knižních publikací ...14

1.2 Rešerše ostatních zdrojů ...15

2 Business Intelligence ...16

2.1 Definice a podstata Business Intelligence ...16

2.2 Princip multidimenzionality ...17

2.3 Architektura Business Intelligence ...19

2.3.1 Datový sklad (DWH) ...20

2.3.2 Datové tržiště (DM) ...20

2.3.3 ETL / ELT ...20

2.3.4 EAI nástroje ...21

2.3.5 Dočasné úložiště dat (DSA) ...21

2.3.6 Operativní úložiště dat (ODS) ...21

2.3.7 Analytické a plánovací aplikace ...21

2.4 Pracovní závěry ...21

3 Self-service Business Intelligence přístup ...22

3.1 Princip a podstata Self-service Business Intelligence ...22

3.2 Postup řešení SSBI úloh ...23

3.3 Trh self-service BI nástrojů ...23

3.4 Pracovní závěry ...24

4 Analýza vybrané úlohy ...25

4.1 Úvodní studie ...25

4.1.1 Charakteristika zákazníka ...25

4.1.2 Současný stav IT podniku ...26

4.1.3 Cíle a očekávané efekty ...26

4.1.4 Funkční požadavky řešení ...26

4.1.5 Pracovní závěry ...27

(7)

4.2.1 Hrubý dimenzionální model ...28

4.2.2 Datový model ...33

4.2.3 Pracovní závěry ...33

5 Implementace úlohy ...34

5.1 Fáze přípravy dat ...34

5.2 Microsoft Power BI Desktop ...34

5.2.1 Integrace dat ...34

5.2.2 Vytvoření dashboardu ...36

5.2.3 Pracovní závěry ...38

5.3 Tableau Desktop ...38

5.3.1 Integrace dat ...38

5.3.2 Vytvoření dashboardu ...40

5.3.3 Pracovní závěry ...42

5.4 SAP Analytics Cloud ...42

5.4.1 Integrace dat ...42

5.4.2 Tvorba dashboardu ...43

5.4.3 Pracovní závěry ...44

6 Zhodnocení použitých nástrojů ...45

6.1 Konektivita ...45

6.1.1 Microsoft Power BI ...45

6.1.2 Tableau ...45

6.1.3 SAP Analytics Cloud ...46

6.2 Integrace dat ...46

6.2.1 Microsoft Power BI ...46

6.2.2 Tableau ...46

6.2.3 SAP Analytics Cloud ...46

6.3 Vizualizace dat ...47

(8)

6.5.1 Microsoft Power BI ...48

6.5.2 Tableau ...48

6.5.3 SAP Analytics Cloud ...49

6.6 Licencování, sdílení ...49

6.6.1 Microsoft Power BI ...49

6.6.2 Tableau ...49

6.6.3 SAP Analytics Cloud ...49

6.7 Celkové hodnocení ...50

6.8 Pracovní závěry ...50

Závěr ...51

Použitá literatura ...52

(9)

Seznam tabulek

Tabulka 1: Terminologický slovník (Zdroj: MBI, 2020) ...10

Tabulka 2: Ukazatel Skladovací náklady (Zdroj: MBI (IQ4003), 2019) ...28

Tabulka 3: Ukazatel Stav zásob zboží (Zdroj: MBI (IQ4001), 2020) ...28

Tabulka 4: Ukazatel Dopravní náklady zásob (Zdroj: MBI (IQ4012), 2020) ...29

Tabulka 5: Ukazatel Dodávkový cyklus (Zdroj: MBI (IQ4002), 2020) ...29

Tabulka 6: Ukazatel Časová norma zásob (Zdroj: MBI (IQ4004), 2020) ...29

Tabulka 7: Ukazatel Počet dní dodávky (Zdroj: MBI (IQ4007), 2020) ...30

Tabulka 8: Ukazatel Obrat zásob (Zdroj: MBI (IQ1015), 2020) ...30

Tabulka 9: Dimenze Čas (Zdroj: MBI (DI001), 2020) ...30

Tabulka 10: Dimenze Region (Zdroj: MBI (DI004), 2020) ...31

Tabulka 11: Dimenze Zboží (Zdroj: MBI (DIQ301), 2020) ...31

Tabulka 12: Dimenze Nákladové druhy (Zdroj: MBI (DIQ054), 2020) ...31

Tabulka 13: Dimenze Dodavatel (Zdroj: MBI (DIQ102), 2020) ...31

Tabulka 14: Dimenze Sklady (Zdroj: MBI (DIQ401), 2020) ...32

Tabulka 15: Dimenze Plán – skutečnost (Zdroj: MBI (DI003), 2020) ...32

Tabulka 16: Možnosti konektivity MS Power BI Desktop (Zdroj: autor) ...35

Tabulka 17: Možnosti konektivity Tableau Desktop (Zdroj: autor) ...39

Tabulka 18: Možnosti konektivity SAP Analytics Cloud (Zdroj: autor) ...42

Tabulka 19: Kritéria hodnocení použitých nástrojů (Zdroj: autor) ...45

Tabulka 20: Celkové hodnocení analyzovaných nástrojů (Zdroj: autor) ...50

(10)

Terminologický slovník

Tento terminologický slovník byl převzat z webu MBI a slouží k objasnění pojmů, které jsou v této práci používány.

Tabulka 1: Terminologický slovník (Zdroj: MBI, 2020)

Aplikace Aplikace - řešení řídících, finančních, obchodních, výrobních a dalších procesů a funkcí podniku pomocí prostředků informačních a komunikačních technologií, tj. aplikačního a základního software, technických a komunikačních prostředků a s nimi spojených služeb poskytovaných jejich uživatelům.

Architektura IS Architektura IS - celkový koncept informačního systému - vize budoucího IS/IT, která zachycuje jednotlivé komponenty IS/IT a jejich vazby, architektura IS/IT se podle úplnosti pokrytí jednotlivých dimenzí (aspektů) IS/IT rozlišuje na architekturu služeb, aplikační architekturu a technologickou.

Atribut Atribut - vlastnost entity nebo sloupec/pole u databázové tabulky nebo položka v datovém souboru. Datová část objektu, tj. proměnná, která je součástí objektu.

BI BI - Business Intelligence - souhrn technologií, a nástrojů, které umožňují na základě aplikace multidimenzionálního přístupu k měření vytvářet a optimalizovat aplikace na podporu analytických a plánovacích aktivit podniku.

CRM CRM - Customer Relationship Management - podniková aplikace pro řízení vztahů se zákazníky.

Business Intelligence Business Intelligence - BI - souhrn technologií, a nástrojů, které umožňují na základě aplikace multidimenzionálního přístupu k měření vytvářet a optimalizovat aplikace na podporu analytických a plánovacích aktivit podniku.

Data Mart / DMA Data Mart - DMA datové tržiště, analytická databáze určená pouze pro určitou část podniku (útvar, oblast řízení apod.).

Data Warehouse / DWH

Data Warehouse - DWH - datový sklad je integrovaný, subjektově orientovaný, stálý a časově rozlišený souhrn dat, uspořádaný pro podporu potřeb managementu.

Databáze Databáze - DB - data, které slouží více aplikacím, jsou v nich minimalizovány redundance dat a existuje vhodně centralizovaná správa těchto dat. Cílem databázového systému je uspořádat datové zdroje (datovou základnu) na počítači tak, aby tyto zdroje mohly být využívány.

Datové tržiště Datové tržiště - Data Mart - DMA - analytická databáze určená pouze pro určitou část podniku (útvar, oblast řízení apod.).

Datová pumpa Datová pumpa - ETL - Extract, Transform, Load - datová pumpa - software pro realizaci transformací dat mezi různými datovými zdroji.

Datový sklad Datový sklad - Data Warehouse - DWH - integrovaný, subjektově orientovaný, stálý a časově rozlišený souhrn dat, uspořádaný pro podporu potřeb managementu.

Datový typ Datový typ - označuje typ dat uložených v proměnné, např. číslo, text apod. Určuje množinu přípustných hodnot a operace s těmito hodnotami.

DB DB - databáze, data, které slouží více aplikacím, jsou v nich minimalizovány redundance dat a existuje vhodně centralizovaná správa těchto dat. Cílem databázového systému je uspořádat datové zdroje (datovou základnu) na počítači tak, aby tyto zdroje mohly být využívány.

Dimenze Dimenze - analytické hledisko pro identifikaci a hodnocení sledovaných ukazatelů a je tak součástí de facto každé metriky. Z informatického pohledu se jeví jako struktura dat, případně jako databázová tabulka obsahující záznamy o jednotlivých prvcích dimenze, tj. např. o jednotlivých službách informatiky, dodavatelích IT apod.

Dimenzionální modelování

Dimenzionální modelování - vymezení všech dimenzí, jejich obsahu, včetně vnitřní hierarchie prvků, a dílčích charakteristik jednotlivých dimenzí, určení soustavy sledovaných ukazatelů (faktů) a jejich dílčích charakteristik, specifikace vazeb mezi ukazateli a odpovídajícími

(11)

Dimenzionální tabulka Dimenzionální tabulka - tabulka obsahující kontext k datům fakt tabulky, obsahuje obvykle textové popisné údaje.

DSA DSA - Data Staging Area - jde o místo v architektuře datového skladu, kde se data ze zdrojových systémů zpracovávají a transformují do podoby dat definovaných dimenzionálním (cílovým) modelem.

Entita Entita - označení obecného jasně definovaného prvku.

ETL ETL - Extract, Transform, Load - datová pumpa – software pro realizaci transformací dat mezi různými datovými zdroji.

ERP ERP - Enterprise Resource Planning - aplikace mající celopodnikový charakter a pokrývající funkcionalitou většinu, resp. velkou část funkcí podnikového řízení.

Fakt Fakt - metrika (zpravidla číselná hodnota), která je v podniku sledována.

Fakt tabulka Fakt tabulka - tabulka obsahující obchodní fakta a hodnoty, zpravidla číselné a aditivní.

Granularita Granularita - úroveň podrobnosti faktů uložených ve fakt tabulce.

Kostka Kostka - označení pro multidimenzionální databázi (nebo její princip). Kostka je realizována buď prostřednictvím multidimenzionální databáze, nebo zvláštní struktury relační databáze.

KPI KPI - Key Performance Indicator - metrika výkonnosti jednotlivých složek procesu (činností a zdrojů procesu), tj. měří jednotlivé činnosti a zdroje procesu, např. dobu trvání činnosti, objem zpracovaných dokumentů, % využití doby operátora service desku apod.

Metrika Metrika - sledovaná a měřená hodnota ukazatele pro potřeby řízení podniku a informatiky.

K ukazatelům se váží dimenze pro jejich identifikaci, analýzy a plánování. Vychází se přitom z principů dimenzionálního modelování.

Multidimenzionální databáze

Multidimenzionální databáze - databáze, kde jsou data uložena na principu vícerozměrové matice. Hodnoty jsou přístupné přímo pro danou kombinaci prvků dimenzí.

OLAP OLAP - Online Analytical Processing - informační technologie založená především na koncepci multidimenzionálních databází. Jejím hlavním principem je několikadimenzionální tabulka umožňující rychle a pružně měnit jednotlivé dimenze a měnit tak pohledy uživatele na modelovanou ekonomickou realitu.

Podnikový proces Podnikový proces - proces, kterým podnik zajišťuje naplnění podnikových cílů, reaguje na významné události a zajišťuje produkci plánovaných výstupů (produktů, služeb apod.).

Primární klíč Primární klíč - klíč, který jednoznačně identifikuje a odlišuje entitu od jiné.

Produkční databáze Produkční databáze - databáze uchovávající data, které vytváří a spravují transakční informační systémy a představují hlavní vstup do řešení business intelligence.

Relační databáze Relační databáze - databáze splňující dvě základní podmínky: databáze je chápána jako množina relací, jsou k dispozici minimálně operace selekce, projektování a spojení.

Report Report - výstup ze software s výsledky hodnot ukazatelů. Může být vyjádřen tabulkou, grafem atd.

Snowflake schéma Snowflake schéma - Schéma sněhová vločka - typ dimenzionálního databázového modelu tvořeného více normalizovanými a nenormalizovanými tabulkami dimenzí.

SSBI / self-service BI SSBI - Self-service Business Intelligence - nástroje umožňující koncovým uživatelům sami analyzovat data bez participace IT oddělení v přípravě analýz.

(12)

Úvod

Lidská společnost stojí na prahu datového věku. Dle nedávné studie (McKinsey Global Institute, 2016) množství dat, které lidská společnost v dnešní době denně vyprodukuje a zpracovává, roste exponenciálním tempem a zdvojnásobí svůj objem každé 3 roky. V důsledku toho pochopitelně společnosti kladou stále větší důraz na význam a porozumění datům s ohledem na výkonnost a konkurenceschopnost firmy. Zároveň je pro podniky důležité, z jakých zdrojových systémů a v jaké kvalitě tato data získávají, kde a v jaké formě je následně uchovávají, jak tato data transformují a konečně jak je analyzují.

Motivů, proč společnosti data zpracovávají a analyzují, je mnoho. Hlavní z nich jsou však zřejmé.

Podniky hledají možnosti, jak optimalizovat své procesy, například zjistit, kde existuje prostor pro snížení určitých nákladů, nebo naopak kde mohou zvýšit marži svých produktů. Nejedná se však jen o pohled z finanční stránky. Stejně důležitá analýza může být z pohledu zlepšování kvality produktů a služeb společnosti. V praxi se však typicky jedná o zásadně podrobnější, úzce zaměřené analýzy týkající se i velmi specifických částí fungování podniku.

Klasický koncept business intelligence předpokládá, že report dle zadání připraví pracovníci IT oddělení, následně jej dle dodatečných požadavků manažera v dalších iteracích případně upraví.

Tomu navíc předchází několik fází celého BI procesu, mezi které patří mimo jiné fáze přípravy dat a jejich transformace. Příprava reportů probíhá v nástrojích, které vyžadují jistou technickou zdatnost a dovednosti nezbytné pro práci s daty.

Naproti tomu se v posledních několika letech stává čím dál více populární self-service business intelligence přístup. Jedná se o variantu, která nepředpokládá nutnost participace IT oddělení ve tvorbě a přípravě reportů pro jejich business uživatele, kteří s jejich výsledky dále pracují a na základě kterých se rozhodují. V praxi to znamená, že manažeři, či obecně jakýkoliv zaměstnanec v business oddělení, jsou schopni si sami zanalyzovat určitá data bez potřeby podpory IT oddělení, které by jim report připravilo. Aby toto bylo možné, předpokládá se, že nástroje self-service BI budou dostatečně intuitivní pro jejich používání.

Vymezení tématu práce a důvod výběru tématu

Tato práce se zabývá analýzou vybraných nástrojů self-service business intelligence, zejména těch, které nabízí klíčoví hráči a leadeři na daném trhu. Zkoumá možnosti jejich využití při implementaci vybrané analytické úlohy SSBI. Zaměřuje se na možnosti konektivity k odlišným datovým zdrojům, transformace dat, vytváření metrik z analyzovaných dat a také možnosti vizualizace dat a formy jejich prezentace.

Toto téma bakalářské práce jsem si zvolil proto, že v oblasti BI v současné době pracuji a je mi tedy blízká. Navíc při ní používám jeden z analyzovaných nástrojů – Microsoft Power BI a chtěl jsem prozkoumat, jakým způsobem se odlišují jeho možnosti od konkurenčních nástrojů dostupných na

(13)

Cíle práce

Hlavním cílem této práce je zanalyzovat 3 vybrané self-service BI produkty při implementaci zvolené analytické úlohy v jejich prostředí. Toho je dosaženo pomocí následujících dílčích cílů:

1. Popsat teoretické principy a postup řešení úloh self-service business intelligence 2. Analyzovat různá řešení ve vybrané úloze self-service business intelligence

3. Zhodnotit odlišnosti implementace vybrané úlohy v různých nástrojích self-service business intelligence

Výsledkem bude jednak návrh řešení vybrané úlohy SSBI, tedy jaké aspekty je při řešení dané úlohy nutné zohlednit. Výstup bude ve formě dimenzionálního modelu a popisu požadavků. Dále práce poskytne hodnocení jednotlivých nástrojů a jejich možností na základě implementace této vybrané úlohy. Hodnocení bude rozdělené do dílčích kritérií.

Předpoklady a omezení práce

Prvním předpokladem této práce je základní představa o aplikacích podnikového informačního systému, především jeho oblasti business intelligence. Práce není omezena na konkrétní, existující společnost. Její řešení představuje obecnou ukázku, jakým způsobem lze implementovat vybranou analytickou úlohu v odlišných nástrojích.

Struktura práce

Práce je strukturována dle obecných doporučení Vysoké školy ekonomické v Praze, Katedry informačních technologií.

Práce začíná úvodní částí, která otevírá řešenou problematiku. Poté následuje rešerše vybraných zdrojů, ze kterých práce čerpá. Poté je definována a charakterizována oblast business intelligence.

V další části se práce věnuje její podmnožině self-service business intelligence. Následně se práce věnuje samotné analýze, popisuje požadavky vybrané úlohy, definuje dimenzionální model. Poté je popsána samotná implementace této úlohy v jednotlivých nástrojích. Poté je práce v těchto nástrojích zhodnocena dle definovaných kritérií. V závěru práce je zhodnoceno, jestli došlo k naplnění cílů práce.

(14)

1 Rešerše vybraných zdrojů

Tato kapitola shrnuje vybrané zdroje, které se věnují oblasti business intelligence. Rešerše byla provedena u zdrojů, které jsou buďto přímo v této práci využity, nebo pomohly v přípravě této práce.

Jedná se převážně o odborné knižní publikace, ale také o odborné články, reporty či kvalifikační akademické práce. K rešerši byly vybrány především ty zdroje, které jsou pro tuto práci stěžejní.

1.1 Rešerše knižních publikací

První vybranou odbornou publikací je titul Self service business intelligence: jak si vytvořit vlastní analytické, plánovací a reportingové aplikace (Pour et al., 2018). Čtenáři dává velmi praktický přehled o celé oblasti BI, v prvním oddílu z pohledu teoretické a metodické roviny, v druhém, obsáhlejším oddílu pak popisuje práci s vybranými SSBI nástroji. Publikace vymezuje principy řešení analytických a plánovacích úloh, metody dimenzionálního modelování, zásady vizualizace dat včetně příkladů, čemu se při vytváření dashboardu vyvarovat. Značná část je také věnována jazyku DAX a jeho funkcím. Velkým přínosem druhého oddílu je mnoho ukázek práce v uživatelském rozhraní při jeho reálném použití na konkrétních úlohách.

Další knihou je Business intelligence v podnikové praxi (Pour et al., 2012), která oproti první uvedené publikaci přináší širší pohled na celou oblast business intelligence, zejména v kontextu jejího využití v různých oblastech podnikového řízení (finance, výroba, logistika, apod.). Jsou popsány jednotlivé komponenty BI a jejich úloha v rámci celého řešení. Kniha se také věnuje přípravě, návrhu a realizaci BI úloh.

The Data Warehouse Toolkit: Practical Techniques For Building Dimensional Data Warehouses (Kimball, 1996) je kniha Ralpha Kimballa, průkopníka oblasti datových skladů, která je jednou z fundamentálních publikací celé oblasti business intelligence. Vymezuje rozdíly mezi transakčními a analytickými databázemi, charakterizuje datové sklady a principy jejich návrhu.

Druhým průkopníkem oblasti návrhu datových skladů, mnohými považován za jejich zakladatele, je H. W. Inmon. Jeho kniha Building the Data Warehouse (Inmon, 2005) podrobně představuje Inmonův přístup k designu a implementaci datových skladů. Zabývá se také souvisejícími aspekty a jejich vztahem k DWH, jako jsou nestrukturovaná data, web, externí data a další.

Kniha Performance Dashboards: Measuring, Monitoring, and Managing Your Business (Eckerson, 2010) popisuje, co dashboardy představují, v jakém kontextu jsou používány a jaké druhy dashboardů existují. Kniha se také věnuje zejména kritickým faktorům úspěšného nasazení a provozu dashboardů v podnikovém IT. Z této publikace byla částečně převzata kritéria pro hodnocení SSBI nástrojů.

(15)

1.2 Rešerše ostatních zdrojů

MBI – Management Byznys Informatiky je online portál, který nabízí mnoho znalostí týkajících se řízení IT podniku prostřednictvím modelových a zobecněných řešení. Pro tuto práci byly čerpány informace zejména o doménách a metrikách, které byly použity v navržené analytické úloze, a dále také informace o faktorech týkajících se business intelligence principů. Z tohoto zdroje byl také použit terminologický slovník (MBI, 2020).

Článek Self-Service Business Intelligence: Empowering Users to Generate Insights. (Imhoff a White, 2011) se věnuje SSBI principům, přičemž klade důraz na použitelnost a snadnou konzumaci obsahu v prostředí SSBI nástrojů. Článek představuje řadu doporučení, která mají přispět k tomu, aby self-service přístup k business intelligence byl úspěšně provozován a business uživatelé byli motivováni sami data analyzovat bez značné závislosti na IT oddělení. Věnuje se také výhodám, které self-service přístup přináší IT oddělení.

Dalším zdrojem byly dokumentace použitých nástrojů v analýze. Z dokumentace Tableau byly získávány dodatečné informace týkající se funkcionality daného softwaru za účelem přesnějšího zhodnocení tohoto nástroje (Tableau, 2020b; 2020c; 2020a). Obdobně byla také použita dokumentace softwaru SAP Analytics Cloud (SAP, 2020d; 2020a) a stejně tak i dokumentace Microsoft Power BI (Microsoft, 2019). Z webových stránek jednotlivých nástrojů byly také získány informace o licencování daných nástrojů (Tableau, 2020d; Microsoft, 2020; SAP, 2020c).

Diplomová práce Tvorba dashboardov v nástroji QlikView (Staško, 2011) popisuje průběh a možnosti práce v tomto nástroji, ten je následně v dané práci i zhodnocen. Autor kritéria hodnocení práce v QlikView sestavil na základě několika odborných publikací. Kritéria některých z původních odborných publikací byla z části převzata i pro hodnocení nástrojů analyzovaných v této bakalářské práci.

Magic Quadrant for Analytics & Business Intelligence (Gartner, 2020) je prestižní report každoročně publikovaný konzultantskou společností Gartner, který hodnotí situaci na určitém trhu informačních technologií, v našem případě BI a analytických nástrojů. Report společnosti a jejich produkty rozděluje do 4 kvadrantů: leaders, challengers, visionaries a niche players. Jednotlivé produkty jsou pak stručně charakterizovány, jsou shrnuty jejich silné a slabé stránky, případně popsány změny oproti předchozímu roku. Tento report sloužil zejména pro výběr nástrojů pro samotnou analýzu.

(16)

2 Business Intelligence

Cílem této kapitoly je vymezit pojem business intelligence, přiblížit aspekty a principy řešení BI a v čem se zásadně odlišují od jiných podnikových aplikací.

2.1 Definice a podstata Business Intelligence

Definicí pojmu business intelligence existuje nespočet. Autor si pro svoji práci vybral tu od společnosti Gartner. Ta používá definici tohoto pojmu z roku 1989 od Howarda Dresnera, tehdejšího analytika Gartner a dnes uznávaného konzultanta v této oblasti:

„Analytics and business intelligence (ABI) is an umbrella term that includes the applications, infrastructure and tools, and best practices that enable access to and analysis of information to improve and optimize decisions and performance.“ (Dresner, 1989)

Business intelligence úlohy jsou oproti jiným úlohám informatiky specifické například tím, že v zásadě nevytvářejí nová data, jak je tomu u transakčních aplikací. Využívají data vytvořená právě transakčními aplikacemi. To s sebou přirozeně nese odlišné nároky na architekturu a uspořádání dat transakčních a BI aplikací. U transakčních typů je důležité, aby aplikace měla co nejrychlejší přístup k datům, mohla s těmito daty efektivně operovat, tj. vytvářet nové, aktualizovat nebo mazat existující záznamy. (Pour et al., 2012) Data transakčních aplikací jsou uložena v relačních databázích. Aby byl umožněn co nejefektivnější přístup k datům mnoha uživatelům, musí tomu databáze být uzpůsobena.

To zahrnuje mimo jiné normalizovaný datový model, který zabraňuje redundanci dat a zachovává jejich integritu, což je jedním z aspektů efektivního fungování OLTP aplikací. (Bog et al., 2012) Naproti tomu mezi nároky na BI aplikace patří zajištění hodnocení ukazatelů výkonnosti (angl. KPI – key performance indicator), které podnik sleduje. Takovým ukazatelem může být například množství skladovaného zboží, rentabilita tržeb, počet zaměstnanců aj. Tyto KPI se analyzují z různých úhlů pohledu, které se označují jako dimenze. Ty přitom mezi sebou lze kombinovat, často podnik mohou zajímat např. hodnoty tržeb dle regionů a kategorií zboží. Zároveň aplikace musejí být schopny sledovat vývoj těchto ukazatelů v čase, a to na odlišných úrovních detailu (typicky v letech, čtvrtletích, měsících, dnech). Analyzovaná data je potřeba kvalitně graficky prezentovat, aby se uživatel aplikace v prezentovaném reportu co nejrychleji zorientoval. (Pour et al., 2018)

Podnikové transakční aplikace, jako jsou ERP, CRM a jiné, ve kterých data vznikají, se označují jako zdrojové. Jelikož data ve zdrojových databázích jsou organizována způsobem, který sice vyhovuje jejich transakčnímu zpracování, avšak není optimální pro poskytování analytických informací, je nutné data transformovat. Struktura transformovaných dat musí být taková, aby hodnoty ukazatelů byly vázány na jednotlivá analytická hlediska neboli dimenze. Takovému uspořádání dat se říká multidimenzionální datový model, nebo také OLAP (Online Analytical Processing) kostka.

K těmto transformacím se používají tzv. datové pumpy. (Pour et al., 2012)

(17)

2.2 Princip multidimenzionality

Multidimenzionální model data rozčleňuje na dimenze, fakta a míry (či ukazatele). Dimenze je typicky textová hodnota, zatímco fakta jsou číselné hodnoty, ukazatele jsou pak odvozeny z faktů.

Charakterizujícím příkladem z retail businessu může být jako faktová tabulka prodej, ukazatelem je poté cena a množství zboží a dimenzí je typ produktu. Multidimenzionální databáze nahlíží na data jako na tzv. kostky, obecně reprezentující libovolný počet dimenzí. Přestože kostka v reálném světě představuje trojrozměrný objekt, v kontextu multidimenzionality se v praxi nejčastěji setkáváme s OLAP kostkami o 4 až 12 rozměrech. (Pedersen a Jensen, 2002) Kostky navíc u dimenzí podporují hierarchii, což umožňuje data analyzovat na různých úrovních granularity. (Pedersen a Jensen, 2002;

Pour et al., 2012)

Dimenze tvoří základní koncept multidimenzionálních databází. Smyslem užití dimenzí je poskytnout co největší kontext analyzovaných dat. Oproti relačním databázím je redundance dat obecně přijatelná, pokud tím poskytuje vyšší informační hodnotu dat. Jak již bylo zmíněno, jelikož BI aplikace nevytvářejí nová data, odpadá tím problém složité aktualizace redundantních dat.

Dimenze jsou organizovány do hierarchického uspořádání. Každá hodnota dimenzionální tabulky patří do určité úrovně hierarchie, reprezentující konkrétní detail pohledu. Mnohdy je navíc v multidimenzionálním modelu výhodné definovat více než jednu hierarchii pro danou dimenzi.

Například u časové dimenze tak lze rozlišit fiskální a kalendářní roky. (Pedersen a Jensen, 2002;

Pour et al., 2012)

Fakta reprezentují analyzovaný subjekt. Ve většině multidimenzionálních modelů jsou fakta definována jako kombinace dimenzionálních hodnot, tedy fakt existuje pouze ve spojení s určitou dimenzí nebo jejich kombinacemi. Některé modely však považují faktové tabulky za rovnocenné objekty se svou vlastní identitou. Jednotlivá fakta mají určitou úroveň granularity, která je odvozena od úrovně detailu jejich asociovaných dimenzí. (Pedersen et al., 2001)

Ukazatele či míry (anglicky measures) jsou tvořeny dvěma částmi: číselnou hodnotou určitého faktu a vzorcem, který může agregovat (typicky se jedná o součet, počet, průměr apod.) více faktových hodnot do jedné, případně provádět jinou matematickou operaci s danou hodnotou (součin, vynásobení konstantou aj.). Z business pohledu se často jedná přímo o KPI, tedy ukazatele výkonnosti podniku. Ty jsou z pohledu analýzy pro uživatele nejzajímavější. Mezi ukazateli rozlišujeme tři typy:

• Aditivní: tyto ukazatele lze smysluplně kombinovat s libovolnými dimenzemi a provádět na nich všechny druhy agregace.

(18)

drill-down a roll-up. První zmíněný představuje pohyb v hierarchii směrem od vyšší úrovně agregace k nižší (tedy k většímu detailu). Roll-up je pak opačnou operací, tedy přechod na vyšší úroveň agregace. Dalším druhem je drill-across, který kombinuje více kostek, které sdílejí jednu nebo více dimenzí, tedy se jedná o relační operaci JOIN. Rotating neboli otáčení kostky znamená pohled na fakta z pohledu jiných dimenzí. Poslední funkcí je ranking nebo dle Thomsen (2002) také top N / bottom N dotazy. Ta se typicky používá pro odpovědi na běžné business otázky z pohledu výkonnosti, například nejprodávanější produkty apod. (Pedersen a Jensen, 2002)

OLAP technologie se v čase vyvíjely a samotná implementace multidimenzionality se liší dle konkrétní technologie. Pour et al. (2018) rozlišuje následující typy OLAP technologií:

• ROLAP (Relational OLAP) – tato technologie využívá relační databázi k zachycení multidimenzionálního modelu.

• MOLAP (Multidimensional OLAP) – k ukládání dat používá speciální binární multidimenzionální OLAP kostky.

• HOLAP kombinuje předchozí dvě technologie.

• WOLAP (Web-based OLAP) – kombinuje webové a OLAP technologie. Podle Hsiao et al.

(2011) výpočty zpravidla běží v aplikaci na straně serveru a klient je prostřednictvím webového prohlížeče prezentuje uživateli.

• DOLAP (Desktop OLAP) – tato technologie stahuje pouze analyzovanou podmnožinu OLAP kostky na lokální počítač, zbytek dat zůstává v centrálním OLAP úložišti.

• RTOLAP (Real-Time OLAP) je kapacitně nejnáročnější, jelikož zpracovává data okamžitě při jejich vzniku a využívají se při in-memory analytice v in-memory databázích.

V případě ROLAP technologie lze dimenzionální model reprezentovat pomocí dvou různých schémat: star a snowflake. Faktová tabulka v každém řádku reprezentuje jeden záznam faktu OLAP kostky, v jednotlivých sloupcích ukládá příslušné ukazatele a cizí klíče k dimenzionálním tabulkám.

Zmiňované dva typy schémat se liší ve způsobu zachycení dimenzí. Star schéma používá jednu tabulku pro jednu celou dimenzi, tedy celou její hierarchii. Data na vyšších úrovních hierarchie se v tabulce budou opakovat s každým odlišných záznamem nižší úrovně v hierarchii. Vzhledem k tomu, že dimenzionální tabulky typicky zabírají 5 % celkového potřebného úložiště, redundance v tomto případě není problémem. (Kimball, 1996; Pedersen a Jensen, 2002)

Oproti tomu snowflake schéma ukládá jednotlivé úrovně hierarchie v konkrétní dimenzi do separátních tabulek. Tím se zabrání redundanci dat, což může být v jistých situacích výhodné. Kromě textových hodnot charakterizujících prvky dané úrovně v hierarchii dimenze obsahují tabulky také cizí klíč k nadřazené úrovni hierarchie. Nevýhodou snowflake schématu je nutnost JOIN operací mezi jednotlivými úrovněmi hierarchie, což klade vyšší nároky na výpočetní zdroje. Kimball (1996) doporučuje využívat snowflake schéma v typových situacích, např. u dimenze finančních produktů bank nebo pojišťoven, kde každý produkt má jiné atributy odlišné pro ostatní produkty. Dalším příkladem je mezipodnikový kalendář. Zde se vyplatí využít snowflake schéma z důvodu, že každý podnik může mít jiný fiskální cyklus. Zároveň Kimball ve většině ostatních případů považuje star schéma za lepší variantu. (Kimball, 1996)

(19)

2.3 Architektura Business Intelligence

V této části je nejprve obecně popsána architektura business intelligence z pohledu vrstev, které ji tvoří. Poté je čtenáři přiblíženo, jak jsou jednotlivé komponenty provázány. V další části kapitoly se práce podrobněji věnuje jednotlivým základním komponentám, ze kterých se architektura BI řešení skládá.

(Novotný et al., 2005) obecně rozděluje komponenty architektury BI do 5 základních vrstev:

• Nástroje pro koncové uživatele

• Analytické komponenty

• Databázové komponenty

• Komponenty datové transformace

• Vrstva oborové znalosti

Vedle samotných vrstev jsou součástí BI řešení také obecné komponenty pro manipulaci a správu dat. To zahrnuje řízení datové kvality, správu metadat a technickou znalost. Díky těmto komponentám je zajištěno, že data, se kterými BI řešení pracuje, odpovídají realitě. Celé BI řešení je dostatečně zdokumentováno, jak na úrovni procesů a koncepce, tak na technické a implementační úrovni. (Novotný et al., 2005)

Druhým možným pohledem na architekturu business intelligence je z hlediska vazeb mezi jednotlivými komponentami. Je však nutné podotknout, že konkrétní podoba uskupení komponent tvořících BI řešení se odvíjí dle potřeb daného podniku, stejně tak dle jeho velikosti. Obecně však lze říct, že s vývojem BI se v čase ustálila jistá koncepce, které odpovídá schéma na Obrázku 1. (MBI (F400), 2019)

(20)

V následující části se práce věnuje vybraným komponentám, které jsou podstatné pro účely této práce.

2.3.1 Datový sklad (DWH)

Do datového skladu jsou data nahrávána pomocí ETL nástrojů z dočasných úložišť poté, co projdou předzpracováním, čištěním a sérií transformací. Jedná se o primární zdroj dat pro analytické a reportingové aplikace. Běžně však odsud nejprve bývají nahrávána do datových tržišť. Určité OLAP nástroje však načítají data přímo z datového skladu (Loshin, 2003). Inmon (2005) tvrdí, že data uložená v DWH musí být konsolidovaná, historizována, subjektivně orientovaná, třídí se tedy podle typu, ne dle zdrojových systémů, ve kterých byla vytvořena. Datový sklad podle Inmona musí být integrovaný, aby pokrýval data vznikající ve všech částech organizace a neomezoval se pouze na její část. Důležitá je i bezpečnost dat. Jejich únik by s sebou nesl vysoké riziko pro společnost. Datový sklad je možné adaptovat v reakci na nové požadavky uživatelů, stejně tak na měnící se prostředí podniku. Samotným problémem jsou pak v čase pomalu se měnící dimenze. (Inmon, 2005; Pour et al., 2018)

Hlavními přínosy datového skladu pro řízení IT a business procesů podniku je zejména poskytování centralizovaného, strukturovaného přehledu nad velkým objemem dat pocházejícím z různých zdrojových systémů. Jeho realizace s sebou obvykle však nese vysoké finanční a technologické náklady. U více než 50 % projektů datového skladu tak bývá překročen jeho rozpočet. Manažeři navíc většinou dostatečně neznají funkcionalitu DWH a jeho možnosti. (Snítil a Šindelář, 2019) 2.3.2 Datové tržiště (DM)

Datové tržiště je svou podstatou a technickou realizací podobné datovému skladu. Hlavní odlišností je jeho užší vymezení pro určitou skupinu uživatelů. Ta může být dána například divizí nebo oddělením podniku. Na počátku jsou vysoce granulární data uložená v datovém skladu. Odsud jsou poté interpretována odlišnými způsoby pro jednotlivé uživatelské skupiny do vyčleněných datových tržišť. Na rozdíl od datových skladů, kde jsou data ukládána v relačním datovém modelu, vhodným databázovým designem pro datové tržiště je dimenzionální model. Hlavní přidanou hodnotou použití dimenzionálního modelu je jeho lehké vytvoření a snadná analýza v něm uložených dat. V datovém tržišti nedochází k modifikaci dat (myšleno přepsáním původních hodnot). Pokud dojde ke změnám v datech, jsou realizovány přidáním nových záznamů do modelu. (Inmon a Linstedt, 2014)

2.3.3 ETL / ELT

Extract, Transform, Load (ETL) je jedním ze základních stavebních kamenů řešení BI. Zajišťuje získání dat ze zdrojových databází, jejich následnou transformaci do vhodné struktury odpovídající datovému modelu cílového úložiště, zpravidla datového skladu nebo datového tržiště. K nahrávání dat nedochází kontinuálně, ale v pravidelném dávkovém režimu, jehož interval může být denní, týdenní, měsíční apod., odvíjející se od více aspektů. Nejnáročnější částí ETL procesů je transformace dat, přičemž ta obvykle pokrývá okolo 60 % pracovních kapacit. I proto je klíčové, aby ze zdrojových databází byla vybrána jen taková data, která jsou potřebná pro analýzu a plánovací úlohy. (Pour et al., 2018) Vedle metody ETL ještě existují další, jako jsou ELT či ETLT, které se liší

(21)

ETL, pokud počet zdrojových systémů je větší než 10 nebo pokud velikost zdrojových dat přesáhne 1 TB. V opačném případě je vhodné zvážit variantu ELT. (Kajeepeta, 2010)

2.3.4 EAI nástroje

Enterprise Application Integration jsou nástroje, jejichž cílem je redukovat počet rozhraní mezi jednotlivými podnikovými aplikacemi pomocí jejich integrace. EAI pracují v real-time režimu. To má v kontextu BI využití zejména pro vytváření real-time Data Warehouse. (Pour et al., 2012) 2.3.5 Dočasné úložiště dat (DSA)

DSA je nepovinná komponenta řešení BI, která se používá ve chvíli, kdy jsou produkční systémy neustále vytíženy a extrakci dat je tak nutné provést co nejrychleji, bez velikého dopadu na běh systémů. Data uložena v DSA zatím nebyla transformována a jsou ve stejné struktuře jako ve zdrojové databázi, jsou tedy nekonzistentní a nehistorizovaná. (Novotný et al., 2005)

2.3.6 Operativní úložiště dat (ODS)

Cílem ODS je vytvořit centralizované místo pro integraci dat ze zdrojových databází. Na rozdíl od DSA se už jedná o konsolidovaná a konzistentní data, někdy již také agregovaná, avšak stále bez historizace. Hlavní odlišností mezi DSA je využití obou komponent. ODS se také využívá jako referenční databáze zákazníků nebo produktů. (Novotný et al., 2005)

2.3.7 Analytické a plánovací aplikace

Tato komponenta představuje klientské aplikace, které mohou být navrženy odlišnými technologiemi. Jejich účelem je poskytovat uživateli graficky interpretované, vizualizované informace, které podpoří manažerské rozhodování. Tyto nástroje implementují analytické multidimenzionální funkce popisované v kapitole 2.2, jako jsou drill-down, drill-up apod. (Pour et al., 2012)

2.4 Pracovní závěry

V úvodní části kapitoly byl vymezen pojem business intelligence, dále pak práce popisuje princip multidimenzionality, na kterém jsou BI řešení založena. K technické realizaci tohoto principu lze

(22)

3 Self-service Business Intelligence přístup

Tato kapitola se zabývá self-service přístupem k řešení business intelligence úloh, který je v současné době jedním z největších trendů v této oblasti. Cílem kapitoly je čtenáři přiblížit, jaké výhody tento přístup podnikům přináší a co je příčinou jeho zavádění. V další části je popsáno, jakým způsobem se řešení úloh SSBI realizuje, z jakých fází se skládá a čím jsou charakteristické.

3.1 Princip a podstata Self-service Business Intelligence

Pojem self-service BI představuje analytické aplikace, které poskytují business uživatelům více samostatnosti při analýze svých dat než u běžných business intelligence úloh, díky jednodušším technologiím a uživatelsky přívětivějším aplikacím. Zároveň se stále jedná o aplikace využívající principy multidimenzionality při analýze a uložení dat. Kvůli absenci vyšší nutnosti IT oddělení vytvářet analýzy pro koncové uživatele, jsou tyto nástroje flexibilnější a rychleji poskytují výstupy pro manažerské rozhodování a tím i zkvalitňují samotný rozhodovací proces. V praxi však self- service BI kompletně nenahrazuje klasický přístup k BI, ale doplňuje jej. Mnohdy jsou také využívány self-service nástroje IT oddělením k vytváření reportů pro manažery, tedy nenaplňují plně podstatu svého významu „self-service“.

Jak uvádí Pour et al. (2018), zavádění SSBI do jisté míry řeší problém dvou protichůdných tendencí v podnikové informatice. Na jedné straně požadují koncoví uživatelé flexibilitu a samostatnost při datové analýze. Na druhé straně IT oddělení podniku potřebuje kontrolovat a řídit přístup k datům společnosti. Mění se tedy role IT oddělení v rámci BI úloh. Na rozdíl od klasického BI, kde IT oddělení plní neustále se měnící požadavky koncových uživatelů na vytváření nových reportů, v prostředí self-service BI je role IT oddělení především v přípravě, čištění dat a jejich zpřístupnění koncovým uživatelům v takové podobě, aby jim rozuměli a nadále již samostatně je mohli analyzovat. Díky tomu IT oddělení není zahlceno neustálými požadavky uživatelů aktualizovat analýzy a může své zdroje lépe využít. (Imhoff a White, 2011)

Aby SSBI v podniku efektivně fungovalo, je nezbytné, aby sami uživatelé zvládali tyto nástroje používat a nespoléhali se tak stále na IT oddělení v přípravě analýz. Bohužel v praxi je toto často jedním z důvodů neefektivního nasazení SSBI nástrojů do produkčního prostředí.

Imhoff a White (2011) definují několik doporučení, která je nezbytné implementovat, aby nasazení SSBI bylo úspěšné. Patří mezi ně mimo jiné monitoring uživatelské aktivity ze strany IT oddělení, který má zajistit bezpečnost podnikových dat a eliminovat rizika jejich úniku. Z počátku je vhodné uživatelům poskytnout pomoc, aby snadno začali provádět analýzy. Z počátku tedy může IT oddělení tvořit reporty a ukázat možnosti, jak lze výstupy vytvářet, případně poskytnout koncovým uživatelům sadu úvodních aplikací a dashboardů, ze kterých mohou do budoucna vycházet. Uživatelé mezi sebou mají mít možnost reporty a dashboardy sdílet a mohou na nich spolupracovat.

(23)

3.2 Postup řešení SSBI úloh

Postup řešení úloh SSBI se může lišit v konkrétních případech projektů. Závisí to zejména na předpokládaném rozsahu, jakým bude SSBI využíváno, kolik bude mít uživatelů, jak složité budou aplikace apod. V této práci se budeme držet postupu, který definuje Pour et al. (2018) dle obvyklých postupů řešení IT projektů. Bude tvořen následujícími kroky:

1. Zpracování úvodní studie 2. Analýza a návrh SSBI aplikací 3. Implementace SSBI aplikací 4. Zavedení do provozu

3.3 Trh self-service BI nástrojů

Na základě každoročního reportu Magic Quadrant pro Analytics & Business Intelligence 2020 (Gartner, 2020) identifikujeme přední technologie na trhu analytických nástrojů a business intelligence řešení.

(24)

Gartner mezi silné stránky SAP Analytics Cloud řadí integraci plánovacích funkcionalit a business intelligence. Za nevýhodu naopak považuje provoz pouze v cloudu. Pro ty, kteří chtějí provozovat SAC v on-premise nasazení, zbývá tak varianta využít SAP technologie, ke kterým se SAC umí přímo připojit, a to např. SAP HANA, SAP BusinessObjects Universes nebo SAP Business Warehouse. (Gartner, 2020)

Mezi silné stránky Tableau uvádí Gartner jednoduchost manipulace s daty a jejich prozkoumání, kdy Tableau nabízí dostupnost řady datových zdrojů a umožňuje je snadno vizualizovat za použití nejlepší praxe. Další výhodou je vysoká náklonnost a entusiasmus jeho uživatelů, o které svědčí i vysoká účast na každoroční uživatelské konferenci. Mezi hrozby pak řadí jeho licencování a dále také rizika měnícího se trhu. (Gartner, 2020)

Jako hlavní silné stránky Power BI zmiňuje Gartner jeho kompletnost a vizi produktu, dále také jeho virální šíření díky zařazení do balíčku Office 365 E5, který nabádá uživatele např. Excel a dalších aplikací k vizualizaci dat prostřednictvím Power BI. Třetí silnou stránkou je samotná funkcionalita Power BI, kterou Gartner vyzdvihuje. Za hrozby a nevýhody považuje spolehlivost a výkonnost některých konektorů, zejména pro SAP Business Warehouse a SAP HANA. Další slabou stránkou je on-premise verze, která oproti cloud verzi má jisté mezery ve funkcionalitě dashboardů a dalších aspektů. (Gartner, 2020)

3.4 Pracovní závěry

Byla vymezena podstata self-service přístupu k business intelligence. Postup řešení takových úloh lze rozdělit do 4 základních kroků, které se ale mohou lišit dle požadavků a charakteristik konkrétních projektů. Byly identifikovány přední nástroje trhu self-service business intelligence na základě reportu Gartner Magic Quadrant pro rok 2020 tohoto trhu. Mezi leadery trhu se v aktuálním ročníku řadí technologie 4 společností: Microsoft, Tableau, Qlik a ThoughtSpot. Byly charakterizovány silné a slabé stránky nástrojů MS Power BI, Tableau a SAP Analytics Cloud. Tyto nástroje budou použity pro analýzu v této práci.

(25)

4 Analýza vybrané úlohy

Tato kapitola se věnuje analýze a návrhu SSBI řešení. Pro účely této práce byla vybrána fiktivní společnost, která představuje roli zákazníka.

Charakteristiky zákazníka, včetně jeho stavu IT podniku byly z části převzaty z kurzu Základy Business Intelligence a následně byly některé položky upraveny (Pour, 2019). Tento kurz autor absolvoval v rámci studia.

4.1 Úvodní studie

Cílem úvodní studie by mělo být zhodnocení aktuálního stavu IT v daném podniku, včetně jeho možností reportingu a analytických úloh. Zákazník je v úvodu studie charakterizován. Je třeba definovat přínosy a cíle, které se od řešení očekávají. Zároveň je klíčové určit, jakým způsobem se plnění těchto cílů v budoucnu bude sledovat a kontrolovat. Je také nutné specifikovat požadavky, které od řešení zákazník očekává. Dále je definován zdroj dat, který bude v SSBI řešení používán. V úvodní studii je také zvolen nástroj, který pro řešení bude použit. Přitom jsou zohledněna určitá kritéria, která se týkají přístupnosti ke zdrojovým datům, zároveň podpory více zdrojů dat, jednoduchost a přehlednost používání nástroje uživatelem a další. V poslední části je určen harmonogram projektu a také finanční stránka projektu, týkající se jeho rozpočtu, odhadovaných nákladů apod. (Pour et al., 2018)

V našem případě Úvodní studie obsahuje pouze ty části, které jsou podstatné pro potřeby a cíl této práce. Je abstrahováno od ekonomických aspektů projektu, včetně harmonogramu.

4.1.1 Charakteristika zákazníka

Společnost se nazývá SPELTICO s.r.o., jedná se o českou společnost obchodující s elektronikou.

Společnost působí na evropském trhu. Firma je středně veliká, má okolo 300 zaměstnanců. Má obchodní pobočky v zemích, kde působí, celkem 20. Pro své zboží využívá vstupní sklady a distribuční sklady, celkem jich je 10 – 3 nákupní a 7 distribučních. Společnost provozuje vlastní online obchod. Odběratele společnosti lze rozdělit do dvou skupin: drobní zákazníci, kteří zboží nakupují prostřednictvím online obchodu, těch je okolo 3000 měsíčně. Druhou skupinou jsou větší

(26)

4.1.2 Současný stav IT podniku

V současné době společnost provozuje ERP systém Microsoft Dynamics NAV. Pro řízení vztahů se zákazníky společnost používá CRM aplikaci Microsoft Dynamics CRM. Pro řízení dodavatelského řetězce využívá komponentu, která je součástí Microsoft Dynamics NAV. Řízení skladů zajišťuje řešení od společnosti WMS.

Interní komunikace zaměstnanců není žádným způsobem normována a může se lišit dle jednotlivých obchodních poboček. Většina z nich využívá k běžné komunikaci emailového klienta Outlook v rámci balíčku Office 365. Některé skupiny uživatelů používají k interní komunikaci platformu Slack. Data vznikající při komunikaci jsou ukládána v souborech na sdílených discích společnosti.

Firma využívá 5 produkčních databází, která provozuje v prostředí Microsoft SQL Server.

Infrastruktura informačního systému podniku je tvořena z 20 serverů. Databáze je využívána aplikacemi Microsoft Dynamics NAV, Microsoft Dynamics CRM a WMS.

Společnost v současné době neprovozuje žádné BI řešení. Veškeré analýzy dat jsou prováděny ad- hoc, typicky se k tomu používají data uložená ve formátech CSV. Ta jsou nahrána do aplikace Microsoft Excel (bez modulu PowerPivot), kde dochází k jejich základní analýze. Neexistuje standardní proces vytváření těchto analýz. Ve většině případů je však vytváří IT oddělení na žádost business uživatelů. Analýzy nejsou v časovém horizontu pravidelné, nesleduje se vývoj KPI metrik v čase. Komunikace a sdílení výstupů těchto analýz pak závisí na účelu a pracovních vztazích mezi jednotlivými business uživateli. Typicky jsou tyto výstupy sdíleny jen v rámci konkrétní obchodní pobočky, případně pouze v rámci její části nebo vůbec.

4.1.3 Cíle a očekávané efekty

Cílem analýzy je vytvořit návrh self-service BI řešení, které bude analyzovat řízení skladů. V rámci řešení bude implementována aplikace analyzující stav zásob na skladech podniku.

V případě úspěšného zavedení SSBI řešení do provozu očekáváme zlepšení řízení nákupu zásob.

V důsledku toho předpokládáme, že skladovací náklady společnosti klesnou o 5 % v horizontu jednoho roku.

Zároveň očekáváme, že s nasazením řešení vzroste informovanost zaměstnanců, zejména business uživatelů, o nakládání společnosti se zásobami zboží. Reporty budou sdíleny mezi příslušnými skupinami pracovníků. To přispěje k lepší koordinaci nákupů zboží od dodavatelů a eliminaci chyb kvůli buďto nadbytečnému nákupu zásob, nebo naopak nedostatečného množství zásob na skladě, který by společnost limitoval v prodeji zboží odběratelům.

4.1.4 Funkční požadavky řešení

Od návrhu řešení se očekává, že bude poskytovat takové informace, které povedou k naplnění stanovených cílů a promítnutí očekávaných efektů do praxe. Aplikace bude vhodně graficky prezentovat sledované ukazatele. K aplikaci budou mít přístup manažeři společnosti i řadoví zaměstnanci. Rozdělení přístupových práv nebude řízeno na úrovni aplikace, ale bude v kompetenci IT oddělení společnosti.

(27)

Aplikace bude sledovat stav zásob zboží, kterým firma disponuje. Požaduje se, aby stav zásob byl sledován:

• v časovém hledisku

• dle skladů, kde je zboží uskladněno

• dle regionů, kde jsou zásoby skladovány

• z pohledu zboží, a to s možností agregovat do vyšších logických celků

• dle dodavatelů, od kterých bylo zboží nakoupeno

Řešení bude také umožňovat sledovat náklady na držení zásob a náklady na dopravu zásob od dodavatelů.

Užití konkrétních dimenzí a ukazatelů včetně jejich struktury je v kompetenci zpracovatele, přičemž se očekává, že použité dimenze a ukazatele povedou ke komplexnímu zachycení analyzované oblasti a budou přínosné pro koncového uživatele aplikace.

Do aplikace bude možné vstupní data nahrát ve formě souboru ve formátu tabulky vytvořené v aplikaci MS Excel. Tento soubor poté uživatel bude moct průběžné aktualizovat, nebude však nutné zasahovat do samotného řešení. Data v těchto souborech budou již připravena do takové podoby, ve které je bude možné přímo analyzovat, a případná úroveň potřebných změn bude minimální, aby je dokázal upravit samotný uživatel. Transformaci dat ze zdrojových databází do této podoby budou zajišťovat pracovníci IT oddělení společnosti a netýká se tak předmětu této analýzy.

Aplikace však zároveň bude podporovat připojení do databázového zdroje provozované v prostředí MS SQL Server. V případě, že se zadavatel rozhodne pro provoz zdrojových databází vstupujících do navrhovaného SSBI řešení v jiném prostředí, bude to konzultovat s řešitelem včas a dle možností aplikace.

4.1.5 Pracovní závěry

V této části byl charakterizován zákazník, který je předmětem této analýzy, a jeho současný stav IT podniku. Následně byly definovány cíle a očekávané efekty, které by jejich naplnění mělo přinést.

V poslední části byly popsány funkční požadavky řešení a jakým způsobem budou integrovány datové zdroje do řešení.

4.2 Návrh řešení

(28)

4.2.1 Hrubý dimenzionální model

Hrubý dimenzionální model charakterizuje dimenze a ukazatele, které jsou v navrženém řešení použity.

Ukazatele

Tabulky představují charakteristiky jednotlivých ukazatelů navržených pro řešení úlohy. Při návrhu ukazatelů autor vycházel z webu MBI, kde jsou ukazatele charakterizovány, a následně je doplnil či upravil dle konkrétních požadavků analyzované úlohy.

Tabulka 2: Ukazatel Skladovací náklady (Zdroj: MBI (IQ4003), 2019)

ID F_SkladovaciNaklady

Název Skladovací náklady

Obsah Objem nákladů spojený s držením určitého množství zásob Zdroj dat Evidence skladů a skladových zásob – export ve formátu .xlsx Jednotka

Datový typ Numeric (10,2) Agregace Aditivní

KPI Ano

Tabulka 3: Ukazatel Stav zásob zboží (Zdroj: MBI (IQ4001), 2020)

ID F_StavZasob

Název Stav zásob zboží

Obsah Počet kusů zboží dostupného na skladě

Zdroj dat Evidence skladů a skladových zásob – export ve formátu .xlsx Jednotka kusy

Datový typ Numeric (10,2) Agregace Aditivní

KPI Ano

(29)

Tabulka 4: Ukazatel Dopravní náklady zásob (Zdroj: MBI (IQ4012), 2020)

ID F_DopravniNaklady

Název Dopravní náklady zásob

Obsah Objem nákladů spojený s přepravou zboží od dodavatele na sklad Zdroj dat Evidence skladů a skladových zásob – export ve formátu .xlsx Jednotka

Datový typ Numeric (10,2) Agregace Aditivní

KPI Ne

Tabulka 5: Ukazatel Dodávkový cyklus (Zdroj: MBI (IQ4002), 2020)

ID F_DodavkovyCyklus

Název Dodávkový cyklus

Obsah Časový úsek mezi dvěma po sobě jdoucími dodávkami Zdroj dat Evidence skladů a skladových zásob – export ve formátu .xlsx Jednotka dny

Datový typ Numeric (10,2) Agregace Semiaditivní

KPI Ne

Tabulka 6: Ukazatel Časová norma zásob (Zdroj: MBI (IQ4004), 2020)

ID F_CasNormaZasob

Název Časová norma zásob

Obsah Čas, během kterého vydrží průměrná zásoba zboží

Zdroj dat Evidence skladů a skladových zásob – export ve formátu .xlsx Jednotka dny

(30)

Tabulka 7: Ukazatel Počet dní dodávky (Zdroj: MBI (IQ4007), 2020)

ID F_PocetDniDod

Název Počet dní dodávky

Obsah Čas na vyprodání aktuálních zásob

Zdroj dat Evidence skladů a skladových zásob – export ve formátu .xlsx Jednotka dny

Datový typ Numeric (10,2) Agregace Semiaditivní

KPI Ne

Tabulka 8: Ukazatel Obrat zásob (Zdroj: MBI (IQ1015), 2020)

ID F_ObratZasob

Název Obrat zásob

Obsah Kolikrát je jedna položka naskladněna v průběhu roku Zdroj dat Evidence skladů a skladových zásob – export ve formátu .xlsx Jednotka dny

Datový typ Numeric (10,2) Agregace Semiaditivní

KPI Ne

Dimenze

Tabulky představují charakteristiky jednotlivých dimenzí použitých pro řešení úlohy. Obdobně jako u ukazatelů, autor vychází z webu MBI, kde jsou dimenze obecně charakterizovány a poté je případně upravil pro potřeby této konkrétní úlohy. Z webu MBI byla také stažena ukázková data jednotlivých dimenzí, která budou použita v implementaci řešení.

Tabulka 9: Dimenze Čas (Zdroj: MBI (DI001), 2020)

ID D_Cas

Název Čas

Zdroj dat Integrováno v aplikaci – pomocí jazyka DAX

Typ Star

Struktura Rok – Pololetí – Kvartál – Měsíc – Týden – Den Atributy ID_Cas, Rok, Pololeti, Kvartal, Mesic, Tyden, Den

(31)

Tabulka 10: Dimenze Region (Zdroj: MBI (DI004), 2020)

ID D_Region

Název Region

Zdroj dat Organizační a řídící dokumenty podniku – export ve formátu .xlsx

Typ Snowflake

Struktura Kontinent – Stát – Region

Atributy ID_Region, Kontinent, Stat, Region

Tabulka 11: Dimenze Zboží (Zdroj: MBI (DIQ301), 2020)

ID D_Zbozi

Název Zboží

Zdroj dat Evidence skladů a skladových zásob – export ve formátu .xlsx

Typ Snowflake

Struktura Kategorie – Skupina – Položka

Atributy ID_Zbozi, Kategorie, Skupina, Polozka

Tabulka 12: Dimenze Nákladové druhy (Zdroj: MBI (DIQ054), 2020)

ID D_NakladoveDruhy

Název Nákladové druhy

Zdroj dat Účetní evidence – export ve formátu .xlsx

Typ Star

Struktura Bez hierarchie

Atributy ID_NakladPolozky, NakladPolozka

Tabulka 13: Dimenze Dodavatel (Zdroj: MBI (DIQ102), 2020)

ID D_Dodavatel

(32)

Tabulka 14: Dimenze Sklady (Zdroj: MBI (DIQ401), 2020)

ID D_Sklady

Název Sklady

Zdroj dat Evidence skladů a skladových zásob – export ve formátu .xlsx

Typ Snowflake

Struktura Kategorie – Sklad

Atributy ID_Sklad, KategorieSklady, KodSklad, NazevSklad

Tabulka 15: Dimenze Plán – skutečnost (Zdroj: MBI (DI003), 2020)

ID D_PlanSkutecnost

Název Plán - Skutečnost

Zdroj dat Manuální – soubor ve formátu .xlsx

Typ -

Struktura Bez hierarchie

Atributy ID_PlanSkutecnost, PlanPolozka, PlanHodnota

(33)

4.2.2 Datový model

V této části autor prezentuje svůj navržený datový model pro řešení úlohy. Datový model zobrazuje vazby jednotlivých ukazatelů na příslušné dimenze. Červeně znázorněné objekty představují ukazatele, modře znázorněné objekty reprezentují dimenze.

Poznámka: Ilustrace datového modelu pro lepší přehlednost nerozlišuje typ dimenze snowflake a star. Veškeré dimenze jsou zde tedy zobrazeny jako jedna entita.

Obrázek 3: Datový model řešení (Zdroj: autor)

4.2.3 Pracovní závěry

Byl navržen hrubý dimenzionální model řešení analyzované úlohy. Skládá se celkem ze 7 ukazatelů a 7 dimenzí. Pro jednotlivé entity bylo stanoveno, že pro připojení dat k analytickému nástroji budou

(34)

5 Implementace úlohy

5.1 Fáze přípravy dat

Fáze přípravy dat probíhala v prostředí nástroje MS Excel. Data pro jednotlivé dimenze byla vytvořena zvlášť v jednotlivých sešitech. Jako výchozí hodnoty byla použita data ukázkových souborů z webu MBI popisující příslušné dimenze, které jsou v úloze použity. Následně byla data upravena dle charakteristiky této úlohy.

Pro potřeby a cíle této práce bylo rozhodnuto, že budou implementovány faktové tabulky pro ukazatele Skladové náklady, Dopravní náklady a Stav zásob a jejich příslušné dimenze. Hodnoty těchto ukazatelů s vazbou na příslušné dimenze byly náhodně vygenerovány pomocí funkce RANDBETWEEN() a za použití relevantních hraničních hodnot. Hodnoty byly vygenerovány pro časové období od 01/2019 do 12/2019. Tomu taky odpovídá časová dimenze, která po úpravě řešitelem obsahuje data v časovém rozmezí roku 2019.

5.2 Microsoft Power BI Desktop

Nástroj MS Power BI Desktop je dostupný pro zařízení s operačním systémem Windows.

V současné době neexistuje verze pro operační systém macOS. Desktop verze je ke stažení zdarma, licencovány jsou služby Power BI Service, které jsou blíže popsány v části 5.2.2.

5.2.1 Integrace dat

Uživatelské rozhraní prostředí MS Power BI Desktop se na první pohled podobá aplikacím rodiny Microsoft Office, zejména svým rozložením pásů karet nástrojů, což může přispět k lepší orientaci při práci s tímto nástrojem.

(35)

Po vytvoření nového souboru lze na domovské kartě nástrojů spustit kontextové menu Načíst data (Get Data). Uživateli se zobrazí okno s dostupnými konektory pro zdrojová data. Power BI nabízí možnost nahrání zdrojových dat do aplikace přímo ze souborů aplikace Excel. Nabídka volby datového zdroje je rozdělena do 6 podskupin konektorů (viz Obrázek 4).

Mezi možnostmi načtení dat ze souboru je mimo Excel možné data získat ze souboru ve formátu XML, JSON, CSV nebo PDF. Power BI také umožňuje připojení složky, a to včetně SharePoint složky. Pro připojení databázových zdrojů nabízí Power BI relativně širokou škálu konektorů. Za zmínku stojí konektory pro MS SQL Server, SAP HANA, Oracle DB, IBM DB2, Impala, PostgreSQL a MySQL. Nabídka Power Platform zahrnuje konektory Power Query a další varianty.

Čtvrtá záložka Azure pak pokrývá jednotlivé konektory čistě pro prostředí MS Azure a souvisejících aplikací. Na kartě Online Služby se nacházejí konektory pro služby především třetích stran, u značné části z nich se v současné době jedná pouze o beta verzi. Mezi službami přímo od Microsoft se zde nachází např. konektor pro SharePoint, Exchange, Dynamics 365 a Dynamics NAV. V poslední nabídce Další se nacházejí i univerzálnější konektory, např. ODBC konektor skript jazyka Python nebo skript jazyka R.

Následující tabulka shrnuje možnosti konektivity v prostředí MS Power BI Desktop.

Tabulka 16: Možnosti konektivity MS Power BI Desktop (Zdroj: autor)

Typ konektoru Počet konektorů

Databáze 36 (z toho 5 v beta verzi)

Soubor 6

Online služba 52 (z toho 29 v beta verzi)

Další 33 (z toho 12 v beta verzi)

Celkem 127 (z toho 48 v beta verzi)

Pro nahrání zdrojových dat řešené úlohy byla použita volba Excel souboru. Soubory jednotlivých dimenzí a faktových tabulek byly nahrány jednotlivě. Při nahrávání zdrojových souborů byly nastaveny datové typy pro jednotlivé sloupce podle návrhu řešení jednotlivých dimenzí. Prostředí Power BI dokáže relativně přesně rozpoznat datový typ sloupce, avšak je lepší provést kontrolu. Lze

Odkazy

Související dokumenty

Tato práce si tudíž klade za cíl navrhnout a implementovat self-service business intelligence (SSBI) řešení konsolidovaného finančního controllingu vybraného

Byly vybrány tři konkurenční Self Service Business Intelligence nástroje, konkrétně Power BI Desktop, Tableau a Qlik Sense Desktop, které jsou v analýzách společnosti

Cílem této úlohy je demonstrovat schopnosti SSBI nástrojů na příkladu mimo business oblast, jelikož tyto nástroje mohou být užitečné ve zdravotnictví, o čemž je

Název práce: Využití prediktivních funkcí v rámci self-service cloud BI Řešitel: Viktor Solanský.. Vedoucí

První části práce se věnují širšímu kontextu řešení a zejména vymezení celé oblasti BI a SSBI a jejich dosavadnímu vývoji, na které pak navazuje vymezení principů

Dílčím cílem bylo přiblížení pojmu Self Service Business Intelligence, jeho teoretické ukotvení v úlohách podnikového řízení a ověření doporučené

V praktické části popsal funkcionalitu a fiktivní příklad použití nástroje SAP Analytics Cloud, který kombinuje vybrané trendy (BI, AI, ML).V této části oceňuji zvláště

Diplomová práce se věnuje oblasti řízení hotelu, návrhu a implementaci Self Service Business Intelligence (SSBI) řešení pro konkrétní ubytovací zařízení. Jedná se o