• Nebyly nalezeny žádné výsledky

Hlavní práce74737_solv04.pdf, 3.6 MB Stáhnout

N/A
N/A
Protected

Academic year: 2022

Podíl "Hlavní práce74737_solv04.pdf, 3.6 MB Stáhnout"

Copied!
78
0
0

Načítání.... (zobrazit plný text nyní)

Fulltext

(1)

Vysoká škola ekonomická v Praze

Fakulta informatiky a statistiky

Využití prediktivních funkcí v rámci self-service cloud BI

BAKALÁŘSKÁ PRÁCE

Studijní program: Aplikovaná informatika Studijní obor: Aplikovaná informatika

Autor: Viktor Solanský

(2)

Poděkování

Rád bych poděkoval své rodině za to, že při mně vždy stála a vždy mě podporovala v rámci studia a také svým přátelům získaných během bakalářského studia, kteří mě obohatili o spoustu zajímavých názorů. Dále bych chtěl poděkovat doc. Ing. Janu Pourovi, CSc. za možnost zpracovat bakalářskou práci pod jeho vedením a za poskytnuté konzultace.

(3)

Abstrakt

Tato bakalářská práce se zaměřuje na analýzu self-service predikcí nástroje SAP Analytics Cloud. Analýza je provedena na vývoji pandemie koronaviru v České republice. Predikce jsou sestaveny pomocí analýzy časových řad a promítnutí historického trendu dat do budoucnosti. Pro sestavení analýzy časových řad je využita funkcionalita Smart Predict a její prediktivní model v nástroji SAP Analytics Cloud.

Práce se nejprve zaměřuje na analýzu současných technologií v oblasti BI a vzájemných rozdílů a výhod jednotlivých nástrojů. Poté je nastíněna technologie SSBI, její základní vlastnosti a výhody oproti klasické BI koncepci. V dalších kapitolách je zdokumentován praktický případ a realizace SSBI úlohy na situaci epidemii koronaviru v ČR. V poslední kapitole je nastíněna současná situace IT ve zdravotnictví a možností aplikace BI a SSBI nástrojů v této oblasti.

Klíčová slova

Business intelligence, koronavirus, predikce, SAP Analytics Cloud, self-service business intelligence.

JEL klasifikace

M15

(4)

Abstract

This bachelor thesis focuses on analysis of self-service predictions in analytic tool SAP Analytics Cloud. Analysis is conducted on time series analysis of coronavirus epidemic situation in Czech Republic. For time series analysis a feature Smart Predict and its corresponding predictive model has been used, which is a part of SAP Analytics Cloud.

Firstly the thesis focuses on analysis of current technologies in Business Intelligence and corresponding advantages and disadvantages of popular tools. Afterward the SSBI technology was introduced and its main characteristics as well as benefits over standard BI solution. In next chapters the practical example of implementation SSBI tool and deriving prediction from data is documented. Lastly, the current situation of healthcare informatics is discussed and the possibilities of BI and SSBI tools usage is introduced.

Keywords

Business intelligence, coronavirus, prediction, SAP Analytics Cloud, self-service business intelligence.

JEL Classification

M15

(5)

Obsah

Úvod ...14

1 Rešerše zdrojů ... 17

1.1 Rešerše knižních zdrojů ... 17

1.2 Rešerše ostatních zdrojů ... 18

2 Business Intelligence ... 20

2.1 Definice Business Intelligence ... 20

2.2 Architektura Business Intelligence řešení ... 20

2.2.1 ETL - Extraction, Transformation and Loading ... 21

2.2.2 EAI – Enterprise Application Integration ... 21

2.2.3 DSA – Dočasné úložiště dat ... 22

2.2.4 ODS – Operativní úložiště dat ... 22

2.2.5 DWH – Datový sklad ... 22

2.2.6 OLAP Databáze ... 24

2.2.7 Analytické nástroje ... 25

2.3 Pracovní závěry ... 25

3 Technologie self-service BI ... 26

3.1 Historie a vývoj ... 26

3.1.1 DSS a 70. až 90. léta ... 26

3.1.2 OLAP databáze a rozvoj BI ... 27

3.1.3 Příchod SSBI a nejnovější trendy ... 27

3.1.4 Pracovní závěry ... 29

3.2 Analýza technologie self-service ... 29

3.2.1 Postup řešení aplikací SSBI ... 29

3.2.2 Data Governance ... 30

3.2.3 Cloud BI ... 31

3.2.4 Limity a omezení self-service nástrojů ... 32

3.2.5 Pracovní závěry ... 32

3.3 Predikce analytických nástrojů ... 32

3.3.1 Tradiční BI predikce ... 34

3.3.2 Self-service predikce ... 35

(6)

3.3.6 Pracovní závěry ... 38

3.4 Příklady self-service nástrojů ... 39

3.4.1 SAP Analytics Cloud ... 39

3.4.2 Tableau ... 40

3.4.3 Microsoft Power BI ... 40

3.4.4 Pracovní závěry ... 40

4 Implementace analytické úlohy a analýza predikcí ... 42

4.1 Uvedení situace ... 42

4.1.1 Využití SSBI nástrojů ... 42

4.2 Data pro analýzu ... 43

4.2.1 Získání a interpretace dat ... 43

4.2.2 Transformace dat ... 44

4.2.3 Problémy s daty ... 45

4.2.4 Pracovní závěry ... 47

4.3 Datový model ... 48

4.3.1 Vytvoření datového modelu ... 48

4.3.2 Obohacení modelu o dimenzi lokace ... 50

4.3.3 Nahrání dat ... 51

4.3.4 Pracovní závěry ... 52

4.4 Vizualizace nasbíraných dat ... 53

4.4.1 Závěry vyvozené z vizualizace ... 53

4.4.2 Porovnání výstupu s ÚZIS ... 55

4.4.3 Pracovní závěry ... 57

4.5 Analýza predikcí ... 58

4.5.1 Očkovací strategie ... 60

4.5.2 Predikce úmrtí ... 62

4.5.3 Predikce počtu nakažených ... 63

4.5.4 Pracovní závěry ... 68

5 IT a BI ve zdravotnictví ... 70

5.1 Současný stav IT ve zdravotnictví ... 70

5.1.1 Stav ze zahraničí ... 70

5.1.2 Stav v ČR ... 70

5.2 Využití BI a SSBI ve zdravotnictví ... 72

5.2.1 Zdravotnictví jako business ... 72

5.2.2 Možnost využití BI a SSBI ... 72

(7)

5.3 Bezpečnost ... 73

5.3.1 Pokusy o napadení zdravotnických systému ... 73

5.3.2 Bezpečnost BI řešení ... 73

5.3.3 Bezpečnost cloudových řešení ... 73

Závěr ... 74

Použitá literatura ... 75

(8)

Seznam obrázků

Obrázek 1: Kimballův přístup k DWH (Zdroj: Pour et al., 2018) ... 23

Obrázek 2: Inmonův přístup k DWH (Zdroj: Pour et al., 2018) ... 24

Obrázek 3: Schéma OLAP kostky (Zdroj: Novotný et al., 2005) ... 25

Obrázek 4: Příklad hybridního prostředí SAP Fiori (Zdroj: Schön, 2018) ... 28

Obrázek 5 Analýza a návrh řešení SSBI, klíčové aktivity (Zdroj: Pour et al., 2018) ... 30

Obrázek 6: Zdroje dat pro PA (Zdroj: Halper, 2014) ... 38

Obrázek 7: Schéma transformace DS efektivní testování (Zdroj: Autor) ... 44

Obrázek 8: Schéma transformace DS očkování (Zdroj: Autor) ... 45

Obrázek 9: Struktura NZIS (Zdroj: Jarkovský 2020) ... 46

Obrázek 10: Vytvoření modelu v SAC (Zdroj: Autor) ... 48

Obrázek 11: Dimenze Account a výčet metrik (Zdroj: Autor) ... 49

Obrázek 12: Schéma datového modelu v SAC (Zdroj: Autor) ... 50

Obrázek 13: Geo Enrichment v SAC (Zdroj: Autor) ... 51

Obrázek 14: Zobrazení obohacené dimenze lokality (Zdroj: Autor) ... 51

Obrázek 15: Data Management fáze (Zdroj: Autor) ... 52

Obrázek 16: Graf proočkovanosti věkových kategorií (Zdroj: Autor) ... 53

Obrázek 17: COVID-19 Dashboard (Zdroj: Autor) ... 55

Obrázek 18: COVID-19: Přehled aktuální situace v ČR (Zdroj: ÚZIS) ... 55

Obrázek 19: Příklad vizualizací od ÚZIS (Zdroj: ÚZIS) ... 57

Obrázek 20: SAP Predictive Scenarios (Zdroj: Autor) ... 60

Obrázek 21: Predikce očkování a pozitivních testů (Zdroj: Autor) ...61

Obrázek 22: Predikce zemřelých (Zdroj: Autor) ... 63

Obrázek 23: Kontextová nabídka Predictive Scenarios (Zdroj: Autor)... 63

Obrázek 24: Predikce počtu nakažených – delší horizont (Zdroj: Autor) ... 64

Obrázek 25: Karta Explanation v Predictive Scenarios (Zdroj: Autor) ... 65

Obrázek 26: Predikce počtu nakažených – kratší horizont (Zdroj: Autor) ... 66

Obrázek 27: Explanation – signální analýza (Zdroj: Autor) ... 67

Obrázek 28: Přehled nakažených za období 24. 4. - 8. 5. 2021 (Zdroj: ÚZIS) ... 67

Obrázek 29: Schéma NZIS (Zdroj: Ministerstvo zdravotnictví) ... 71

(9)

Seznam zkratek

AI Artificial Intelligence (umělá inteligence) BI Business Intelligence

BP bakalářská práce

COVID-19 Coronavirus disease of 2019 (Nemoc koronaviru 2019)

CRM Customer Relationship Management (Systém pro řízení vztahu se zákazníky)

ČNB Česká národní banka

ČR Česká republika

ČSÚ Český statistický úřad DMA Data Mart

DS Datová sada

DSA Data Staging Area DSS Decision support system DWH Data Warehouse

EAI Enterprise Application Integration

ERP Enterprise Resource Planning (Plánování podnikových zdrojů) ETL Extract Transform Load

FIS Fakulta informatiky a statistiky HDP Hrubý domácí produkt

IaaS Infrastructure as a Service

ICT Information and communication technology ISIN Informační system infekční nemoci

IT Information technology KHS Krajská hygienická stanice

MAE Mean average error (Střední relativní chyba)

(10)

ODS Operational Data Store OLAP Online Analytical Processing PA Prediktivní analytika

PaaS Platform as a Service

PCR Polymerase chain reaction (Polymerázová řetězová reakce) SaaS Software as a Service

SAC SAP Analytics Cloud

SCM Supply Chain Management (Správa dodavatelského řetězce) SSBI Self-service Business Intelligence

ÚZIS Ústav zdravotnických informací a statistiky ČR

(11)

Terminologický slovník

Tento terminologický slovník je určen pro vysvětlení a objasnění pojmů užitých v této práci.

Uvedené pojmy jsou převzaty z MBI a uvedeny v Tabulka 1.

Tabulka 1: Terminologický slovník (Zdroj: MBI, 2021)

Analýza Analýza – postup, jehož výstupem je logický model vytvářeného systému.

Aplikace Aplikace – řešení řídících, finančních, obchodních, výrobních a dalších procesů a funkcí podniku pomocí prostředků informačních a komunikačních technologií, tj. aplikačního a základního software, technických a komunikačních prostředků a s nimi spojených služeb poskytovaných jejich uživatelům.

Architektura Architektura – fundamentální uspořádání systému, které tvoří komponenty a vztahy mezi nimi, včetně vztahu k prostředí, a principy, které řídí jeho návrh a rozvoj. (ISO42010, 2007)

Architektura IS Architektura IS - celkový koncept informačního systému - vize budoucího IS/IT, která zachycuje jednotlivé komponenty IS/IT a jejich vazby, architektura IS/IT se podle úplnosti pokrytí jednotlivých dimenzí (aspektů) IS/IT rozlišuje na architekturu služeb, aplikační architekturu a technologickou (Hindls,R.: Ekonomická encyklopedie, 2003)

Bezpečnost Bezpečnost – vlastnost podnikové informatiky, jejíž úroveň je ovlivněna všemi aspekty, které souvisí s definováním, dosažením a udržováním vhodného stupně bezpečnostních požadavků (důvěrnost, integrita, dostupnost, individuální zodpovědnost, autenticita a spolehlivost) respektující kulturu a odvětví, ve kterém je IS/IT provozován.

BI BI – business intelligence – souhrn technologií, a nástrojů, které umožňují na základě aplikace multidimenzionálního přístupu k měření vytvářet a optimalizovat aplikace na podporu analytických a plánovacích aktivit podniku

Cloud computing Cloud computing – metoda přístupu k využití výpočetní techniky, která je založena na poskytování sdílených výpočetních prostředků a jejich využívání formou služby. Existují nejrůznější modely služeb a možnosti jejich poskytování, ale všem typům cloud computingu je společná schopnost poskytovat prostředky na vyžádání, elasticky, samoobslužně a prostřednictvím přístupu z rozsáhlé sítě a také schopnost měřit spotřebované služby v rámci sdíleného fondu prostředků.

Data Data – jakékoli fyzicky (materiálně) zaznamenané znalosti (vědomosti), poznatky, zkušenosti nebo výsledky pozorování procesů, projevů, činností a prvků reálného světa. Data mohou být zaznamenána jak nepočítačovým

(12)

Data Warehouse Data Warehouse – DWH – datový sklad je integrovaný, subjektově orientovaný, stálý a časově rozlišený souhrn dat, uspořádaný pro podporu potřeb managementu.

Databáze Databáze – DB – data, které slouží více aplikacím, jsou v nich minimalizovány redundance dat a existuje vhodně centralizovaná správa těchto dat. Cílem databázového systému je uspořádat datové zdroje (datovou základnu) na počítači tak, aby tyto zdroje mohly být využívány.

Datová pumpa Datová pumpa – ETL – Extract, Transform, Load – datová pumpa – software pro realizaci transformací dat mezi různými datovými zdroji Datový typ Datový typ – označuje typ dat uložených v proměnné, např. číslo, text

apod. Určuje množinu přípustných hodnot a operace s těmito hodnotami Dimenze Dimenze – analytické hledisko pro identifikaci a hodnocení sledovaných ukazatelů a je tak součástí de facto každé metriky. Z informatického pohledu se jeví jako struktura dat, případně jako databázová tabulka obsahující záznamy o jednotlivých prvcích dimenze, tj. např. o jednotlivých službách informatiky, dodavatelích IT apod.

Dimenzionální modelování

Dimenzionální modelování – vymezení všech dimenzí, jejich obsahu, včetně vnitřní hierarchie prvků, a dílčích charakteristik jednotlivých dimenzí, určení soustavy sledovaných ukazatelů (faktů) a jejich dílčích charakteristik, specifikace vazeb mezi ukazateli a odpovídajícími dimenzemi.

DSA DSA – Data Staging Area – jde o místo v architektuře datového skladu, kde se data ze zdrojových systémů zpracovávají a transformují do podoby dat definovaných dimenzionálním (cílovým) modelem.

ERP ERP – Enterprise Resource Planning – aplikace mající celopodnikový charakter a pokrývající funkcionalitou většinu, resp. velkou část funkcí podnikového řízení

Fakt Fakt – metrika (zpravidla číselná hodnota), která je v podniku sledována.

Faktor Faktor – souhrnné vyjádření v MBI pro organizační, ekonomické, technologické a další podmínky řešení a realizaci úloh řízení podniku a informatiky, např. úroveň managementu, existence nabídky cloud computingu, různých typů aplikací apod.

Granularita Granularita – úroveň podrobnosti faktů uložených ve fakt tabulce.

Implementace Implementace – realizace navrženého systému v programovém prostředí.

Informační systém Informační systém – systém pro sběr, přenos, uchování, zpracování a poskytování dat (informací, znalostí) využívaných při činnosti podniku.

Jeho komponentami jsou IT, data a lidé.

IS/ICT IS/ICT – Informační systém a informační a komunikační technologie – systém pro sběr, přenos, uchování, zpracování a poskytování dat (informací, znalostí) využívaných při činnosti podniku.

IT aplikace IT aplikace – softwarová aplikace, která se používá v rámci úlohy. Může to být například CASE nástroj, analytické aplikace, aplikace pro řízení projektu, spolupráci apod.

IT služba IT služba – aktivita a/nebo informace dodávané poskytovatelem IT služby příjemci služby. IT služba je vytvářena IT procesy, které při svém průběhu konzumují IT zdroje (hardware, software, data, lidé). Službu poskytovatel příjemci dodává na základě dohodnutých obchodních a technických podmínek.

(13)

Key Performance Indicator

Key Performance Indicator – KPI – metrika výkonnosti jednotlivých složek procesu (činností a zdrojů procesu), tj. měří jednotlivé činnosti a zdroje procesu, např. dobu trvání činnosti, objem zpracovaných dokumentů, % využití doby operátora service desku apod.

Komponenta Komponenta – stavební blok aplikace, samostatná binární část kódu Konektivita Konektivita – možnost vzájemného propojení nebo připojení, zpravidla

konektivita síťová, databázová apod.

Kostka Kostka – označení pro multidimenzionální databázi (nebo její princip).

Kostka je realizována buď prostřednictvím multidimenzionální databáze, nebo zvláštní struktury relační databáze.

Metoda Metoda – představuje známou a v rámci úloh modelu MBI aplikovatelnou metodu manažerského (např. BSC, RPZ atd.), ekonomického (např. ABC, ROI atd.) nebo informatického charakteru (datové modelování, dimenzionální modelování atd.).

Metrika Metrika – sledovaná a měřená hodnota ukazatele pro potřeby řízení podniku a informatiky. K ukazatelům se váží dimenze pro jejich identifikaci, analýzy a plánování. Vychází se přitom z principů dimenzionálního modelování.

Multidimenzionální databáze

Multidimenzionální databáze – databáze, kde jsou data uložena na principu vícerozměrové matice. Hodnoty jsou přístupné přímo pro danou kombinaci prvků dimenzí.

OLAP OLAP – Online Analytical Processing – informační technologie založená především na koncepci multidimenzionálních databází. Jejím hlavním principem je několikadimenzionální tabulka umožňující rychle a pružně měnit jednotlivé dimenze a měnit tak pohledy uživatele na modelovanou ekonomickou realitu.

Podnikový proces Podnikový proces – proces, kterým podnik zajišťuje naplnění podnikových cílů, reaguje na významné události a zajišťuje produkci plánovaných výstupů (produktů, služeb apod.).

Produkční databáze Produkční databáze – databáze uchovávající data, které vytváří a spravují transakční informační systémy a představují hlavní vstup do řešení business intelligence.

Report Report – výstup ze software s výsledky hodnot ukazatelů. Může být vyjádřen tabulkou, grafem atd.

SaaS SaaS – Software-as-a-Service – služba, resp. model poskytování aplikací, kde jejich funkcionalita je zajišťována poskytovatelem této služby značnému počtu uživatelů prostřednictvím internetu. Specializovaný poskytovatel tak udržuje a provozuje jak samotnou aplikaci, tak IT infrastrukturu nutnou k jejímu provozu a případné doplňkové služby.

Soubor Soubor – posloupnost (proud) bitů uložených jako samostatná jednotka.

SQL SQL – Structured Query Language – databázový dotazovací jazyk SSBI / self-service BI SSBI – Self-service Business Intelligence – nástroje umožňující koncovým

uživatelům sami

analyzovat data bez participace IT oddělení v přípravě analýz.

Třída Třída – zobecnění objektu nebo jiné třídy (generalizace). Z třídy lze děděním odvodit jinou třídu (podtřídu) nebo instancí odvodit objekt, objekty téže třídy mají stejnou strukturu, liší se pouze hodnotami svých

(14)

Úvod

V dnešní rychle se vyvíjející společnosti jsou data velmi důležitá. Nejenom, že roste jejich objem, což potvrzuje nedávná studie (Splunk, 2021), ale roste hlavně jejich význam, co se týče řízení podniků a strategického plánování. Objem dat přibývá tak rychle, že 57 % dotázaných ve studii od společnosti Spunk odpovědělo, že jejich podnik nedokáže držet krok s rostoucím objemem dat. Čím dál více společností se proto stále více zaměřují na datovou politiku a snaží se buď samy, anebo s pomocí konzultačních firem tyto data zužitkovat a interpretovat. Díky tomuto pozitivnímu trendu, se přední společnosti zabývající implementací a vývojem Business Intelligence nástrojů, zaměřují na tyto nástroje a snaží se je neustále zdokonalovat. Nejnovější technologie implementují tzv. Cloud řešení, aby dokázaly podchytit neustále se zvětšující objem dat a zároveň poskytují velmi intuitivní prostředí, tzv. self-service analytiku, aby uživatel nemusel mít rozsáhlé technické znalosti ohledně interpretace dat, ale aby mohl pouze tuto technologii na maximum využít.

Jak již bylo zmíněno, téměř drtivá většina komerčních společností sbírá data a interpretuje.

Současná epidemie koronaviru nám však ukázala i jiný pohled: data jsou důležitá i pro náš osobní život a můžeme se na základě těchto dat dozvědět víc a mohou nám pomoci udělat rozhodnutí, která můžou zachraňovat životy nebo je výrazně ovlivnit. Další problém, se kterým se současná společnost potýká jsou dezinformace. Dnes je lehčí než kdy dříve něco napsat na internet, zdánlivě označit spolehlivý zdroj a hned je dezinformace na místě. Kdyby byly fakta podkládána daty a bylo by možné pro uživatele s těmito daty interagovat, mohlo by to zásadně pomoct v boji s dezinformacemi. Proto v jedné z následujících části byl sestaven přehledný report, který zobrazuje přehledně statistiky, co se týče koronaviru v České republice.

S rostoucím objemem dat také roste i složitost operací nad daty a je také složitější pochopit kontext dat. Pomyslná vzdálenost mezi lidmi, kteří potřebují výstupy z dat a mezi těmi co data spravují se tedy neustále zvětšuje. Na tento problém narazila klasická koncepce BI, kdy jeden člověk zadá, co potřebuje a druhý report zpracuje. Proti tomuto negativnímu trendu se snaží bojovat technologie SSBI, která rozděluje role v rámci organizace více explicitně, ovšem klade větší nároky na koncové uživatele, tedy zadavatele reportu.

Vymezení tématu práce a důvod výběru tématu

Tato práce se zabývá analýzou self-service Business Intelligence, možnostmi využití této technologie s rozšířením a důrazem na schopnost predikcí. Z praktického hlediska je využit nástroj SAP Analytics Cloud. Predikce a mnohé další funkcionality tohoto nástroje jsou demonstrovány na současném případu pandemie koronaviru v České republice. Metody predikcí jsou v této práci omezeny na limity nástroje SSBI, a tedy predikce a forecast jsou hlavně určeny pomocí lineární regrese nebo trojitého exponenciálního vyrovnávání. Tyto analýzy následně budou zpracovány jako vizualizace v rámci reportů, pro které byly vystavěn příslušný datový model.

(15)

Toto téma jsem si vybral, protože v momentální firmě, kde pracuji se zabýváme reportingem a BI a chtěl jsem tedy rozšířit své znalosti v tomto oboru. Jsem také rozhodnut pokračovat na magisterském studiu se specializací Business Intelligence, tudíž mi tato bakalářská práce pomůže v budoucím studiu. Praktická aplikace dat koronaviru byla pro mě zajímavá i z důvodu zjištění, jak data ohledně průběhu pandemie v ČR vypadají a díky této analýze pochopit, proč vláda ČR učinila některé kroky. Díky této práci a povědomí struktury COVID-19 dat v ČR také získám dobrý základ pro odhalení dezinformací a komplexnější pohled na situaci koronaviru v ČR. V neposlední řadě se považují za analytického člověka, protože se rád rozhoduji na základě dat a na vyhodnocení plusů a mínusů. Proto je mi tématika Business Intelligence blízká a je pro mě relativně jednoduchá k pochopení a uchopení.

Cíle práce

Hlavním cílem práce je analýzy self-service technologie s následným zaměřením na oblast predikcí. Tento cíl je zobrazen pomocí praktické aplikace na data ohledně koronaviru v ČR.

Pro lepší pochopení pro čtenáře je tedy nejprve uvozeno téma Business Intelligence, a poté představena technologie self-service Business Intelligence. Na závěr je přidána kapitola zabývající se stavem IT ve zdravotnictví a jsou dány možnosti či příklady využití technologií BI nebo SSBI v této oblasti. Cíle této práce jsou tedy:

1. Definice BI

2. Analýza self-service řešení

3. Rozbor a analýza prediktivních funkcí

4. Implementace praktického příkladu týkajícího se koronaviru 5. Vyhodnocení analýzy

6. Zhodnocení IT ve zdravotnictví

Předpoklady a omezení práce

Práce se zaměřuje na analýzu a ukázku self-service predikcí. Predikce jsou demonstrovány na současné pandemické situaci v České republice. Tato práce není odbornou prací na téma koronaviru, protože zde chybí nutné biologické a zdravotní komentáře. Tato práce se spíše snaží nastínit možnost a potřebu datové analytiky ve zdravotnictví a kontrastuje tuto potřebu s jednoduchostí a srozumitelností self-service nástrojů.

Struktura práce

Práce je strukturována dle obecných doporučení Vysoké školy ekonomické v Praze, Katedry informačních technologií.

Práce nejprve začíná úvodem, kde se snaží nastínit problematiku a představit strukturu práce. Dále následuje rešerše vybraných zdrojů, které jsou podstatné pro tuto práci. Poté je stručně definován základní pojem Business Intelligence a dále je popsána technologie

(16)

souvisejících s epidemií. V poslední kapitole jsou nastíněny základní nedostatky a potřeby správy dat ve zdravotnictví a ochrany těchto dat a jsou položena doporučení, která se týkají možnosti zavedení IT potažmo BI či SSBI řešení ve zdravotnictví.

(17)

1 Rešerše zdrojů

Tato kapitola prezentuje základní zdroje, které byly využity pro tuto práci. Rešerše zahrnuje zdroje, které se věnují tématu business intelligence, anebo přímo specifičtěji self-service business intelligence. Byly použity i publikace zabývající se tématikou koronaviru jak v České republice, tak i v zahraničí a literární díla zabývající se problémem spojeným se zaváděním IT v sektoru zdravotnictví. Jedná se především o knižní publikace tuzemských, ale i zahraničních autorů a také se jedná o odborné vědecké články z magazínů či novin

1.1 Rešerše knižních zdrojů

První vybranou knihou je Business intelligence v podnikové praxi (Pour et al., 2012). Tato kniha čtenáři poskytuje ucelený a celistvý pohled na problematiku Business Intelligence, definuje základní pojmy a jednotlivé dílčí části celého ekosystému. Kniha se poté detailněji věnuje popisu implementace BI nástrojů v různých odvětvích podnikového řízení (např.

logistika, produkce, finance apod.).

Druhým stěžejním literárním dílem pro tuto práci je titul Self service business intelligence:

jak si vytvořit vlastní analytické, plánovací a reportingové aplikace (Pour et al., 2018). V této knize autoři v prvním oddílu popisují princip multidimenzionálního modelování a přístupu k datům. Dále zde najdeme přístupy a doporučení, jak uchopit SSBI a zda jej vůbec potřebujeme, nebo je pro danou úlohu či problém vhodnější použit klasický přístup k BI.

V neposlední řadě jsou autory doporučeny různé metody reportingu. Ve druhém oddíle jsou teoretické poznatky předvedeny na praktických příkladech z různých nástrojů (např. Power BI, Power Pivot, Tableau, Qlik Sense, Qlik View, Targetty) a následně jsou vyjmenovány základní rozdíly mezi jednotlivými nástroji. Kniha dává velmi celistvý přehled o schopnostech SSBI a označil bych ji jako velmi přínosnou pro pochopení co SSBI obnáší a jak jej implementovat.

Třetí zahrnutou publikací je kniha Healthcare Informatics : Improving Efficiency and Productivity (Kudyba, 2010). Tato kniha popisuje možnost využití IT technologií v oblasti zdravotnictví. Autor nejprve popisuje současný stav zdravotnictví ve Spojených státech, ze kterého celá analýza vychází. Ukazuje možné příklady, které by podle něj zvýšily efektivitu a produktivitu. V knize se nejprve zabývá tématem restrukturalizace zdravotnictví a nastavení procesů, aby ICT technologie měly co největší pozitivní dopad na zlepšení požadovaných metrik. V druhé části knihy se autor zajímá otázkou dat ve zdravotnictví a možností self-service datových analýz. Tato kniha byla hojně využita především v poslední části této BP při sestavě doporučení pro sektor zdravotnictví v ČR, správy dat a následné práce s nimi.

(18)

jelikož princip multidimenzionality je základním stavebním prvkem pro současná BI/SSBI řešení, která stále více získávají na popularitě. Problematiku datových skladů dále rozvádí i dílo Building the data warehouse od B. Inmona (Inmon, 2002), která popisuje odlišný přístup k sestavení BI architektury než jaký doporučuje R. Kimball.

Dalším stěžejním literárním dílem pro tuto práci a zejména pro část predikcí je Predictive business analytics: forward looking capabilities to improve business performance (Maisel a Cokins, 2014). Autoři v této knize popisují principy a možnosti prediktivní analytiky a jak tuto technologii uchopit a provázat s BI architekturami. Důraz je zejména kladen na pochopení metrik a indikátorů, které jsou klíčové a u kterých dává smysl je zkusit predikovat. Kniha je velmi obsáhlá a všechny své teoretické poznatky demonstruje na praktických příkladech z různých oblastí (finanční plánování, logistika, produkce) a akcentuje nutnost přizpůsobit PA danému byznysu a dané oblasti.

Pro implementační část SSBI nástroje byla hojně využita kniha Learning SAP Analytics Cloud (Ahmed, 2017). Toto dílo se věnuje zhodnocení nástroje SAC a poskytuje výborný základ pro seznámení se s nástrojem a pochopení základních funkcionalit. Na tuto knihu navazuje německá publikace Smart Predict in SAP Analytics Cloud (Vahlkamp et al., 2020), která podrobněji zpracovává tématiku predikcí v rámci nástroje SAC.

1.2 Rešerše ostatních zdrojů

Ostatní zdroje tvoří zejména odborné vědecké články, které byly pro tuto práci vybrány.

Společnost Gartner sestavuje spoustu přehledných reportů na téma Business Intelligence a jedním z nejcennějších a každoročně vydávaných je Magic Quadrant for Analytics &

Business Intelligence (Gartner, 2021). Tento report shrnuje změny za předchozí rok v oblasti BI, popisuje novinky u jednotlivých společností a jejich technologií a sumarizuje celkový trh BI a trendy tohoto trhu.

Z oblasti odborných vědeckých článků bylo čerpáno zejména z Building Technology and Predictive Analytics Models in the SAP Analytic Cloud Digital Service (Nazarov et al., 2020).

Článek vyšel v časopise věnovaném konferenci v roce 2020 na téma Business Informatics.

Článek obsahuje demonstrativní příklad aplikace SAC Predictive Analytics na situaci ruských komerčních společností a jejich závislosti na klíčových atributech (lokalita, právní forma atd.). Další využitý odborný článek má název Self-Service Business Intelligence:

Empowering Users to Generate Insights (Imhoff a White, 2011). Jedná se o kvalitní zdroj informací ohledně principů SSBI, jak přistoupit k zavádění SSBI a co jsou největší problémy při zavádění SSBI řešení, tedy zejména motivace koncových uživatelů a nastavení správné role pro IT oddělení.

Za velmi přínosný lze také označit článek Predictive Analytics for Business Advantage (Halper, 2014), který se věnuje již specifičtěji oblasti PA a její provázanosti do oblasti řízení podniku a rozhodovacích procesů. Autor vysvětluje, že nekonzistentní a špatná data mohou způsobit jednu z hlavních překážek na cestě ke kvalitním predikcím.

(19)

Online portál MBI – Management Byznys Informatiky nabízí spoustu znalostí v oblasti řízení IT podniku a business informatiky. Pro tuto práci byly čerpány poznatky týkající se se SSBI, Cloud BI a Mobilní BI. Druhým blokem znalostí čerpaným z toho webu, byly informace ohledně prediktivní analytiky a prediktivní analýzy, které poskytly cenné informace o typech PA, slabých a silných stránkách PA nebo praktické příklady použití PA v různých byznysových odvětvích.

Značný přínos pro tuto práci měla i oficiální dokumentace datových sad ohledně koronaviru v ČR (ÚZIS, 2021a) a analýza zdrojů dat pro COVID-19 datové sady od pana Jarkovského.

(Jarkovský, 2020) Tyto dokumenty srozumitelně čtenáře seznámí s datovými sady a popisují momentální strukturu datového toku v rámci zdravotnictví v ČR.

(20)

2 Business Intelligence

Cílem této kapitoly je vymezit pojem business intelligence, přiblížit aspekty a principy řešení BI a v čem se zásadně odlišují od jiných podnikových aplikací.

2.1 Definice Business Intelligence

Pojem Business Intelligence již existuje řadu let, a tak vznikla řada definic. Autor si pro účel práce vybral definici:

„Business Intelligence (BI) je sada procesů, znalostí, aplikací a technologií, jejichž cílem je účinně a účelně podporovat řídicí aktivity ve firmě. Podporují analytické, plánovací a rozhodovací činnosti organizací na všech úrovních a ve všech oblastech podnikového řízení, tedy prodeje, nákupu, marketingu, finančního řízení, controllingu, majetku, řízení lidských zdrojů, výroby a dalších.“ (Pour et al., 2018)

Pomocí předchozí definice tedy můžeme blíže rozlišit jaký je rozdíl mezi klasickými transakčními aplikacemi a BI aplikacemi. Transakční aplikace mají za účel především zajistit okamžitý přístup k jednotlivým detailním datům co se týče jednotlivých objednávek, faktur, informace o zboží apod. Tyto aplikace také mohou vytvářet nová data, resp. záznamy pomocí interaktivního prostředí a interakcí s vnějším prostředím podniku či s interakcí vně podniku. Business Intelligence aplikace naproti tomu se snaží zhodnotit sledované podnikové ukazatele např. objem tržeb, počet pracovníků, počet defektů atd. jejichž většinou pocházejí z transakčních systémů. Aplikace BI tyto ukazatele hodnotí ve vztahu k různým hlediskům (dimenzím) a jejich kombinací. Příklad takové dimenze může být čas, lokalita nebo jednotlivé divize či konkrétněji pobočky. V neposlední řadě tyto nástroje umí výsledné analýzy prezentovat v co nejpřehlednějším a nejkvalitnějším grafickém zobrazení pomocí dashboardů, reportů, stories, atd. (Pour et al., 2012)

Z předchozího odstavce lze tedy usoudit, že transakční systémy většinou používají koncoví zaměstnanci neboli operativa proto, aby jejich každodenní práce byla snazší, efektivnější a jejich výsledky byly automaticky zaznamenávány. Aplikace BI používají především manažeři či majetkově zainteresované osoby, nebo osoby v kontrolních orgánech, aby mohly analyzovat výsledky svých produktů či svých zaměstnanců. (Sherif, 2016)

2.2 Architektura Business Intelligence řešení

Business Intelligence řešení jsou komplexní end-to-end systémy které pokrývají vše od extrakce dat až po interakci s koncovým uživatelem. Podle (Novotný et al., 2005) lze architekturu BI rozdělit do následujících 5 vrstev:

(21)

• vrstva pro extrakci, transformaci, čištění a nahrávání dat,

• vrstva pro ukládání dat,

• vrstva pro analýzy dat,

• prezentační vrstva,

• vrstva oborové znalosti.

Kromě výše zmíněných vrstev se v řešení BI objevují i obecné komponenty, které zajišťují odpovídající datovou kvalitu, resp. že data jsou konzistentní s realitou. Dále tyto komponenty zajišťují dokumentaci a popis probíhajících procesů a s tím spojenou technickou znalost, obsahující vědomosti získané implementačním týmem. (Novotný et al., 2005)

V následujících podkapitolách jsou nejdůležitější komponenty BI architektury pro kontext této semestrální práce vysvětleny a je popsán princip multidimenzionality. Nutno podotknout, že v této práci je vysvětlen obecný přístup k uchopení architektury BI a jednotlivá řešení v realitě se můžou výrazně lišit v závislosti na typu podnikání a hlavnímu účelu BI jako komplexního nástroje a sady procesů.

2.2.1 ETL - Extraction, Transformation and Loading

ETL lze považovat za jednu z nejdůležitějších komponent celého BI řešení. V praxi lze ETL nazývat i též jako datová pumpa. Hlavní funkcí datové pumpy je získat data, nejčastěji ze zdrojových transakčních systému. Může se jednat o ERP, SCM, CRM systémy, se kterými zaměstnanci určitého podniku přichází dennodenně do styku. následně je upravit a očistit do požadované podoby a v posledním kroku je nahrát do specifických struktur, zpravidla do DSA. Odtud tedy název nebo označení Extraction, Transformation, Loading. Tyto činnosti probíhají v dávkovém režimu, což znamená že po určité periodě (den, týden, měsíc) se stáhnou data ze zdrojových systému provede se nutná transformace a data se buď přidají (append) nebo celá smažou a nahrají úplně nová (rewrite) nebo se pouze připíšou nová data (update). Datové pumpy jsou z hlediska pracnosti velmi zdlouhavé a je nutné vědět dopředu strukturu datového skladu, aby mohla být data správně připravena. Nicméně každý čas investovaný v této fázi přípravy BI řešení se později zúročí, neboť správně nastavené datové pumpy, a především dobře zpracovaná transformace, usnadní poté kroky následující a předejde se možným problémům u konečných analýz. (Sherif, 2016; Pour et al., 2012)

2.2.2 EAI – Enterprise Application Integration

Tyto nástroje jsou dnes již zpravidla využívány hlavně ve vrstvě zdrojových systému. Jejich hlavním účelem je zmenšit vzdálenost (krokovatelnost) mezi transakčními systémy a datovým úložištěm. Své využití dnes představují hlavně v možnosti přenášet data v reálném čase. Liší se tím tedy od ETL, které pracují výhradně v dávkovém režimu. (Novotný et al., 2005)

(22)

2.2.3 DSA – Dočasné úložiště dat

DSA neboli Data Staging Area je první komponentou BI řešení, která se týká ukládání dat.

DSA slouží primárně k prvotnímu uložení získaných dat ze zdrojových systémů. Tento mezikrok mezi produkčními systémy a datovým skladem není povinný, ale je důležitý hlavně u případů, kdy zatížení produkčních systémů je vysoké a je potřeba optimalizovat tok dat s ohledem na výkonnost těchto systémů. Druhý případ užití DSA je, pokud zdrojová data nejsou ve formátu relačních tabulek, ale zdrojových souborů (např. soubory MS Excel, MS Access či textové soubory). (Novotný et al., 2005)

2.2.4 ODS – Operativní úložiště dat

Další volitelnou komponentou ukládání dat je ODS (Operational Data Store). Tato komponenta slouží jako podpora pro určitou část podniku, která potřebuje buď aktuální data ze transakčních systémů (např. call-centrum potřebuje údaje o zákazníkovi ihned), nebo potřebuje pouze určitou část datového skladu, nad kterou provádí analytické operace (typicky třeba historie jednotlivého zákazníka v bance, zdali mu půjčit nebo ne). ODS se tedy od DSA liší hlavně tím, kdo s ním přijde do styku. ODS využívají i koncoví uživatelé, DSA slouží pouze k dočasnému uložení dat a po nahrání do DWH jsou data smazána.

2.2.5 DWH – Datový sklad

Datový sklad dnes představuje jednu z nejdůležitějších a nejběžnějších součástí podnikové IT infrastruktury. S rostoucím objemem dat rostou také nároky na výpočetní zátěž ale i na bezpečnost, jelikož firma všechna svá data shromažďuje na jednom místě a mohlo by tedy dojít k úniku citlivých informací. Existuje široké množství definic datového skladu, nejrozšířenější je však definice od (Inmon, 2002) kterou později převzali i další významní průkopnici oblasti datového modelování jako Humphries, Ponniah a Todman. Definice zní:

„Datový sklad je specifický druh relační databáze. Datový sklad se liší od běžné databázi svými vlastnostmi, které musí každý datový sklad mít. Mezi tyto vlastnosti patří schopnost být integrovaný, konsolidovaný, subjektově orientovaný, stálý a časově rozlišitelný souhrn dat, uspořádaný pro podporu managementu.“

Subjektově orientovaný znamená, že data jsou tříděna podle jejich typu, nikoliv podle zdrojů. Konsolidovaný datový sklad je jednotný a má pouze jednu verzi pravdy. Schopnost být integrovaný zajišťuje, že všechna data z podniku jsou ukládána na jednom místě, tedy přímo v DWH. Stálost označuje schopnost zůstat konzistentní v čase a být zpravidla přístupný pouze pro čtení (read-only). Časová rozlišitelnost znamená, že data jsou v DWH archivována a je možné zobrazit tabulky faktů a dimenzi v závislosti na dimenzi času.

(Inmon, 2002; Pour et al., 2018)

Jak již bylo řečeno, datový sklad je nejdůležitější částí architektury BI a namodelování a zprovoznění takového skladu často dopadá překročením jak časového, tak i finančního limitu. Ve 21. století se rozvinuly dvě hlavní teorie namodelování DWH a jejich přilehlých komponent tzv. Datových tržišť. Datová tržiště (neboli Data Mart, DMA) se ve své podstatě a struktuře moc neliší od DWH, ale liší se podstatně svým účelem. Zatímco DWH má sloužit

(23)

jako celopodnikový sklad a přístup k němu může získat každý oprávněný uživatel, Datamarty jsou určena pouze pro určitá specifická oddělení či organizace uvnitř celého podniku. První teorii o DWH a Datamartech rozvinul již dříve zmíněný W. H. Inmon a o druhou se zasloužil R. Kimball. V následujících podkapitolách jsou oba přístupy rozvedeny do většího detailu a shrnuta doporučení, kdy je lepší, který přístup použít. (Pour et al., 2012)

Kimballův přístup k DWH

Ralph Kimball popisuje tržiště jako decentralizované datové sklady, které jsou poté integrovány do centrálního DWH. Znamená to tedy, že nejprve jsou namodelovány jednotlivá tržiště a poté je z nich postupně poskládán datový sklad. Jedná se tedy o tzv.

bottom-up přístup. Data v centrálním skladu jsou již uspořádána do dimenzionálního schématu, což znamená že jsou rozděleny tabulky faktů (typicky se jedná o tabulky s převážně číselnými záznamy např. tržby, náklady a jednotlivé identifikátory) a tabulky dimenzí (mohou to být zákazníci, lokalita). Tabulky dimenzí tvoří metriky či kritéria, jak se můžeme dívat na tabulky faktů. (Kimball a Ross, 2013)

Obrázek 1: Kimballův přístup k DWH (Zdroj: Pour et al., 2018)

Inmonův přístup k DWH

Druhý přístup je tzv. top – down. Jedná se tedy o přístup, kdy je prvně namodelován centrální datový sklad, který je tedy co nejblíž zdrojovým produkčním systémům a data do něj plynou přímo z DSA. Tímto přístupem se zajišťuje jedna verze pravdy a je zde snaha o omezení redundance dat, jak nejvíce to jde. Datová struktura je modelována na základě entit, které se v daném podniku vyskytují a je následně sestaven logický model s vazbami na jednotlivé tabulky v datovém skladu. Jednotlivá datová tržiště jsou poté pouze odvozením a částí datového skladu. V Datamartech Inmon poté již doporučuje použít klasický dimenzionální přístup, který Kimball používá pro celý datový sklad. (Inmon, 2002)

(24)

Obrázek 2: Inmonův přístup k DWH (Zdroj: Pour et al., 2018)

Porovnání obou přístupů

Oba přístupy jsou v dnešní době korektní, ovšem oba přístupy začínají mít problém s neustále se měnící strukturou dat, z důvodu neustálého vzniku dat nových. Hlavní výhodou prvně modelování DWH je, že struktura DWH více odpovídá struktuře daného podniku a je tedy daleko jednodušší případně upravit strukturu DWH. Na druhé straně modelování DWH podle Inmona je složitější, časově náročnější, a tedy i nákladnější. Je potřeba nejprve identifikovat jednotlivé business entity, což může zabrat spoustu času.

Z tohoto důvodu je Kimballova metoda vhodnější pro menší podniky a start-upy, které nepotřebují nutně celopodnikový přehled a stačí jim sledovat základní KPI. Menší podniky také nechtějí podstoupit vysoké počáteční náklady, které s sebou Inmonův přístup přináší.

(Maślankowski, 2013)

2.2.6 OLAP Databáze

OLAP databáze se skládají z jedné či více navzájem souvisejících a propojených OLAP kostek. OLAP kostky se skládají z dimenzí, faktů a ukazatele. Dimenze si lze představit jako textové hodnoty (např. jednotlivé pobočky a jejich atributy – adresa, otevírací doba, zodpovědná osoba), fakta jsou číselné hodnoty (náklady, prodej) a ukazatele jsou odvozeny od faktů (v našem příkladě by se jednalo o průměrný nájem poboček a jejich počet, čímž bychom spočítali celkové náklady na nájem pro podnik). Tyto OLAP databáze umožňují rychlé analytické pohledy na data a již často obsahují předpřipravené agregace. Můžeme se setkat i s tzv. hierarchiemi, které tvoří strukturu dimenzí. Typickou hierarchií si jde představit lokalitu, kdy nejnižší člen (tzv. leaf) může být okres a následnou hierarchii poté tvoří kraj, do kterého okres patří. Díky OLAP databázím lze pak jednoduše zobrazit přehledy přes rodiče (parent) v našem případě tedy kraj, tak i zobrazit detailnější pohled přímo přes daný okres. (Novotný et al., 2005)

(25)

Obrázek 3: Schéma OLAP kostky (Zdroj: Novotný et al., 2005)

2.2.7 Analytické nástroje

Analytické nástroje tvoří koncový článek celého BI řetězce. Tyto aplikace jsou typicky určené pro poskytování ‚manažerských“ informací a zobrazují plnění cílů. Tyto přehledy se snaží co nejjednodušeji zobrazit pomocí přehledných moderních a interaktivních grafických zobrazení. Nejčastějšími možnosti jsou tzv. dril up, dril down, kdy si uživatel zobrazuje přehledy od nejdetailnějšího pohledu dané dimenze k obecnější. V praxi se jedná o aplikace např. IBM Cognos TM1, SAP Business Objects, Oracle Hyperion Financial. Tyto nástroje se poté většinou dotazují na již zmíněné OLAP databáze či na jednotlivá tržiště a vytvářejí přehledy, reporty a dashboardy. Tyto aplikace v poslední době se velmi rozvinuly, protože již pouze neukazují jednoduché přehledy nad historickými daty, ale jsou vylepšovány o možnosti plánování, predikce či analýzy trendů a vyvození závěrů.

2.3 Pracovní závěry

V úvodu této kapitoly byl vysvětlen pojem business intelligence a co vše BI obnáší.

V následující podkapitole byly představeny jednotlivé komponenty BI architektury, které jsou klíčové pro kontext této práce a pro pochopení rozdílu mezi BI a SSBI. Byl vysvětlen princip multidimenzionality pomocí OLAP databází a byly vyjmenovány nejznámější koncové analytické nástroje, které následně dodají požadovanou analýzu a zobrazí přehledný report pro rychlé pochopení a vysvětlení dané situace.

(26)

3 Technologie self-service BI

Pojem self-service lze do češtiny volně přeložit jako „sám-odbavující“ či „sám-obsluhující“.

Nelze však interpretovat tento název či překlad tak, že by vše dokázal zařídit koncový uživatel tedy ve většině případů manažer nebo jiný představitel managementu. SSBI pouze dává větší kontrolu koncovému uživateli a tento přístup řešení se snaží co nejvíce usnadnit cestu ke konečným analýzám. Nutno podotknout, že klasická koncepce BI a SSBI nejsou dva různé přístupy k řešení a tyto koncepce se můžou navzájem prolínat a kombinovat.

V poslední době je však možné pozorovat značný vzestup a oblíbenost SSBI koncepcí, protože nabízí nesporné výhody oproti klasické koncepci BI, které budou charakterizovány v následujících kapitolách. První je stručně nastíněna historie BI a poté SSBI pro lepší pochopení dané problematiky, následně je popsána samotná koncepce SSBI a třetí podkapitola se věnuje predikcím, které moderní SSBI nástroje nabízí. (Pour et al., 2018)¨

3.1 Historie a vývoj

Business Intelligence lze považovat za relativně nový směr technologií ICT a metod řízení podniků. Historii tohoto oboru lze mapovat až do 60. let minulého století do USA. Dříve top management a stakeholdeři firmy plánovali strategii a cíle podniku na základě historických dat, většinou již rok či dva starých. Data nebyla nijak centralizovaná, docházelo k časté ztrátě dat a většina záznamů ani nebyla uchovávána digitálně. V praxi vše stálo na intuici daného výkonného ředitele, někdy dokonce i na čiré náhodě. S vývojem výpočetní techniky a jejím rozvojem v rámci podnikové IT infrastruktury se začala shromažďovat data a výkon procesů již dokázal vypočítávat analytické operace nad těmito daty. (Power, 2007)

3.1.1 DSS a 70. až 90. léta

Pojem Business Intelligence zavedl až v roce 1989 analytik společnosti Gartner Howard J.

Dresner. Předchůdcem dnešní analytiky a BI byly DSS (Decision Support Systems). První vážnější zmínky o DSS přicházejí z let 1966–1971 kdy Scott Morton ve své disertační práci zkoumal podporu strategického plánování pomocí vlastně navrženého systému a otestovaného modelu. Jednalo se o navržení měsíčního plánu produkce myček a sušiček pro společnost Westinghouse. Daniel J. Power jako spoluautor knihy Decision Support: An Examination of the DSS Discipline (Schuff, 2011) zorganizoval řízený rozhovor v subkapitole číslo 2 se Scottem Mortonem. Morton uvádí jako svůj největší přínos oblasti DSS svůj první experiment ve již zmíněné společnosti Westinghouse. (Power, 2007; Pour, 2006)

V 80. letech se odborná společnost i firmy začaly více zajímat o možnost analytiky a zjistit něco více než konkurence. Tento boom odstartoval John Rockart publikací článku, který vedl k vývoji EIS (Executive Information System), založenými na multidimenzionálním

(27)

uložení a zpracování dat. V roce 1981 byla uspořádána v Georgii první konference zabývající se problematikou DSS, kde se rozdělily hlavní proudy DSS:

• modelově-řízené DSS,

• datově-řízené DSS,

• komunikačně-řízené DSS,

• dokumentově-řízené DSS,

• znalostně-řízené DSS.

A právě datově-řízené DSS daly základ pro dnešní sofistikované BI analytické nástroje později SSBI nástroje. (Power, 2007; Pour, 2006)

3.1.2 OLAP databáze a rozvoj BI

S nástupem EIS v 80. letech v USA se začal rozvíjet také nový přístup ke skladování a analýze dat. S rozvojem OLAP struktury a multidimenzionálního přístupu k datům, byly položeny základní kameny k BI v podobě, jak jej známe teď. (Power, 2007) ve svém díle zmiňuje snahu společnosti Procter&Gamble v roce 1985 vyvinout systém, který provázal informace o prodejích (kde, co, jak, kdy) s daty získanými z obchodů při prodeji (za kolik, jaké množství) jako milník a jedním z prvních a nejúspěšnějších datově-orientovaných DSS.

Trh s EIS se poté později rozrůstal a od roku 1993 se tyto produkty začaly prosazovat i na českém a slovenském ICT trhu. (Pour, 2006)

Na přelomu 80. a 90. let se začal v USA projevovat nový trend v oblasti multidimenzionálních technologií, a to datové sklady (DWH) a datová tržiště (Data Mart).

Představiteli těchto přístupů byly R. Kimball a B. Inmon, kteří oba ovšem přišli s jinými způsobení provedení. Sám Inmon v rozhovoru s Danielem J. Powerem uvedl, že koncepce DWH je jeho největší přínos, který právě této oblasti přinesl. (Schuff, 2011). Společnosti nadále investovaly do systému pro správu a analýzu dat, a tak se součástí řešení staly i reportovací služby a grafické služby, protože množství dat narůstalo a již nebylo dostatečné reprezentovat tyto data pouze v jednoduchých tabulkách. Společnost Walmart držela v roce 1995 více než 5 TB dat a v roce 1997 to bylo již více než 24 TB dat. (Power, 2007; Pour, 2006) Od začátku nového tisíciletí si firmy stále více uvědomují důležitost BI a považují tuto oblast za jednu z nejperspektivnějších k investování. Společnost Gartner tvrdí, že trh s analytickými a BI nástroji opět vzrostl, a to až o 10 %. Největším a nejrychleji rostoucím segmentem zůstávají moderní BI platformy s podílem téměř 18 % na celkovém trhu.

(Gartner, 2020)

3.1.3 Příchod SSBI a nejnovější trendy

S rostoucím zájmem o BI a rozšířením do všech oborů a oblastí podnikání začal být vyvíjen tlak na BI systémy být více flexibilní, rychlejší a integrovanější pro vrcholový management.

(28)

týmy. Datová kultura a celkové firemní prostředí se začíná transformovat. Díky úspěchu BI nástrojů v rozhodování a řízení firmy se ekonomicky orientované profese začínají čím dál tím více orientovat v datech a jejich analýze. Tento pozitivní trend pomáhá hlavně SSBI nástrojům, které mohou nabízet větší funkcionalitu pro své uživatele. Další pomocnou silou pro SSBI je rozvoj cloudu. Přední dodavatelé SSBI řešení stále více upřednostňují cloudová řešení, která jsou mnohonásobně jednodušší na zavedení, protože není potřeba instalovat servery a datové sklady. (Gartner, 2018)

Nejnovější trendy v analytice a potažmo SSBI analytice začíná být rozšířená realita.

Společnost Gartner předpovídá, že schopnost analytických nástrojů data analyzovat pomocí složitých modelů, machine learningu a umělé inteligence bude klíčová pro budoucí generaci SSBI. Přístup těchto nástrojů bude ze současného „prezentovat volbu a závěry zvolené uživatelem“ k „prezentovat vlastní vyvozené závěry danému uživateli.“ Rozdíl je zde tedy zásadní, zatímco v prvním případě je člověk ten, kdo vymýšlí analýzu a závěry které chce získat, ve druhém případě pomyslné „kormidlo“ přebírá program. (Gartner, 2021)

Dalším trendem, který je již dlouho očekáván je postupná integrace BI, potažmo spíše SSBI na mobilní zařízení a tablety. (Imhoff a White, 2011) a (Howson a Scorecard, 2012) předpokládali vzestup a i možný přenos analytiky na přenosná zařízení. Předpokládali tedy hlavně implementaci interaktivního reportingu, čímž umožní dodavatelé BI řešení ještě širší záběr pro uživatele, kteří tak budou moci prezentovat své analýzy téměř kdykoliv a kdekoliv, protože mobilní zařízení má dnes každý u sebe. Největší překážku těchto mobilních řešení vidí v implementaci jednoduchého a ovladatelného prostředí, které navazuje na intuitivní rozhraní z počítače. S rozvojem 4G a dnes i 5G sítí a cloud-computingu se tato představa stává realitou. Společnost Business Wire (ANON., 2017) odhaduje do roku 2025 růst trhu mobilního BI o 23,3 % na konečných 26,8 miliard amerických dolarů v roce 2025. Jen pro srovnání, v roce 2019 byl celý trh BI naceněn na 20,5 miliardy dolarů a v roce 2025 je očekáván nárust na 40,5 miliardy. Tyto čísla pouze ukazují, jaký potenciál mobilní BI skrývá, a že ještě nejsou zcela všechny možnosti BI vyčerpány. (Gartner, 2020)

Obrázek 4: Příklad hybridního prostředí SAP Fiori (Zdroj: Schön, 2018)

(29)

3.1.4 Pracovní závěry

Technologie SSBI má své kořeny již v 60. letech s příchodem rozhodovacích systémů a transformací dat z papírové podoby do elektronické. Zásadním milníkem bylo objevení multidimenzionálního přístupu ke skladování a analýze dat, který umožnil propojení více oblastí, a tedy komplexnější analýzu. Postupně byla vyvíjena architektura BI řešení a s rostoucím objemem dat již nestíhalo IT oddělení plnit všechny požadavky koncových uživatelů, a proto vznikla technologie SSBI. Ta se v současnosti teprve ukotvuje mezi podniky a stále více přechází do cloudu pro zrychlení výpočetní doby. Nejnovějšími trendy na poli SSBI je přenesení analytiky na mobilní zařízení a rozšířená realita, a tedy schopnost těchto nástrojů téměř „nahradit“ lidské myšlení. SSBI nástroje data zanalyzují a přinesou už výsledné vyhodnocení, které dříve musel udělat člověk při pohledu na data potažmo reporty.

3.2 Analýza technologie self-service

Samotná koncepce SSBI se snaží vyřešit problém, který nastává při použití klasické koncepce BI. Na jedné straně stojí koncoví uživatelé – manažeři, analytici, kteří chtějí mít kontrolu nad výstupy z dat a na druhé straně stojí IT oddělení s potřebou mít nad daty neustálou kontrolu a zajišťovat jednu verzi pravdy. Tyto zdánlivě protichůdné síly se snaží řešit koncepce SSBI, která umožňuje koncovým uživatelům větší flexibilitu a individualitu, ale pořád zachovává klasickou architekturu BI s datovým skladem, Data Marty atd., o které se nadále může starat IT oddělení. (Pour et al., 2018)

S příchodem SSBI si tedy IT oddělení mohlo „oddechnout“, protože už nebylo třeba dennodenně spouštět složitá queries a vytvářet reporty, aby vyhověli požadavkům koncových business uživatelů, kteří mnohokrát ani neměli ponětí o tom, jak data vypadají a co vlastně by chtěli. Podle studie (Imhoff a White, 2011) 65 % dotázaných odpovědělo, že existuje potřeba SSBI kvůli neustále měnícímu se prostředí v organizaci. Celých 57 % odpovědělo nespokojenost s časovou odezvou od IT oddělení co se týče požadavků na analytické operace. Pro úspěšnou implementaci SSBI do podniku je tedy velmi důležité, aby existoval těsný vztah mezi IT oddělením a koncovými uživateli. IT oddělení by mělo umožnit co nejjednodušší přístup k datům pro business uživatele a zabývat se výhradně datovou kvalitou, přístupem a bezpečností. Koncoví uživatelé by měli být seznámeni s datovou strukturou a rozumět principům multidimenzionality, aby byli schopni sami dodat požadované analýzy. Díky této vzájemné harmonii a rozdělení práce lze dosáhnout daleko vyšší efektivity a kvality analýz. (Britt, 2020)

3.2.1 Postup řešení aplikací SSBI

(30)

• zpracování úvodní studie pro SSBI,

• analýza a návrh SSBI aplikací,

• implementace SSBI aplikací,

• zavedení do provozu SSBI aplikací.

První a poslední úloha jsou však velmi závislé na situaci výše zmíněných faktorů a mohou být například téměř vypuštěny.

Úvodní studie je velmi důležitá, zejména pokud organizace nemá jasně definované cíle pro SSBI, nebo nemá s analytikou jako takovou žádné zkušenosti. Dnešní SSBI nástroje umí pracovat bez samostatného datového skladu, který jak bylo již dříve řečeno, většinou tvoří nejnákladnější a časově nejnáročnější nákladovou položku celého BI konceptu. Úvodní studie tedy zastupuje podobnou roli jako projektový záměr u projektového řízení, protože odpovídá na základní otázky: co, jak, proč, kdy, za kolik. Po úvodní studii následuje analýza a návrh SSBI aplikací. V této části je zásadní spolupráce jak koncových uživatelů, tak IT oddělení, aby byly požadované cíle naplněny. Jednotlivé úlohy analýzy a návrhu řešení SSBI popisuje obrázek 4. (Pour et al., 2018)

Obrázek 5 Analýza a návrh řešení SSBI, klíčové aktivity (Zdroj: Pour et al., 2018)

Předposlední fáze před samotným spuštěním a zavedením SSBI je implementace. V této části je navržené řešení naplněno prvotními daty a jsou vytvořeny základní datové modely.

Jedná se tedy o prvotní nastavení řešení a uvedení do praxe. SSBI nástroje se snaží být velmi intuitivní a co nejvíce vstřícné vůči uživatelům, ovšem tito uživatelé by měli být během této fáze seznámeni se všemi funkcionalitami a možnostmi. Ideální je, pokud IT oddělení prezentuje různá demo řešení, kterými demonstruje přímo čeho jsou nástroje schopné. Poté je řešení finálně spuštěno a je ze strany IT oddělení udržována podpora pro stávající, či nové uživatele, které je potřeba proškolit. (Pour et al., 2018)

3.2.2 Data Governance

S velkou mocí přichází také velká zodpovědnost. Tato slavná věta zazněla již v několika filmech, či knihách a platí i pro SSBI. S přibývajícím počtem uživatelů systému a zejména

(31)

těch, kteří mají pouze základní povědomí o datech a celém ekosystému BI, přibývá exponenciálně zátěž na systém. Pokud si více uživatelů bude vytvářet samostatné reporty pro své vlastní účely je zřejmé, že budou vznikat reporty s podobným či totožným významem. Tyto zbytečné reporty poté zbytečně zatěžují systém či datové úložiště a mohou vést i k havárii systému. Dalším problémem mohou být subsety, neboli vlastní verze datasetů. Uživatelé si mohou oříznout pouze část dat, či je nelogicky propojit s jiným datasetem a může tedy docházet k milné interpretaci dat a v tomto případě je SSBI spíše kontraproduktivní. V neposlední řadě více uživatelů znamená větší počet dotazů nad daty, která se přepisují v reálném čase, a tedy opět vyšší zátěž na systém. (Stodder, 2020)

Řešením tohoto problému je zavedení stromové struktury, kam si uživatelé mohou své reporty ukládat a aktivně podporovat uživatele ke sdílení svých reportů. Tímto způsobem jsou zajištěny i přenosy znalostí a tzv. best-practices co se týče SSBI, jelikož uživatelé si navzájem radí a sdílí tipy. Je také velmi důležité rozdělit role a práva v rámci SSBI, aby případná neznalost uživatelů nemohla napáchat velké škody jako například smazaní veškerých dat. Dalším možným řešením, hlavně tedy pro větší organizace, je implementace SSBI, a hlavně tedy reportingu do vnitropodnikového systému. Pokud budou nejdůležitější reporty přístupné všem, i když nemají s SSBI zkušenosti, ale používají vnitropodnikový systém, lze předejít zvýšenému zatěžování systému (Stodder, 2020)

3.2.3 Cloud BI

Příchod SSBI nástrojů akceleroval přechod celých BI řešení do cloudu. V České republice v roce 2018 využívalo jakékoliv cloud řešení pouze 25,5 % podniků. Lídry v tomto případě v Evropě jsou severské státy, kde finské podniky vykazují již přes 60 % cloud řešení.

Nejčastějšími důvody, proč firmy přechází na cloud řešení jsou: (MBI (FSG490), 2021)

• snížení nákladů na implementaci, provoz a údržbu IT ve firmě,

• přizpůsobitelnost a škálovatelnost Cloud služeb,

• zkrácená doba nasazení aplikací,

• snazší a rychlejší obnova služeb po výpadku.

Cloudová řešení se dnes rozlišují na 3 základní vrstvy: IaaS, PaaS, Saas. Na vrstvě IaaS (Infrastructure-as-a-Service) se zabezpečuje úložiště dat a výpočetní výkon. Komponenty z infrastrukturní vrstvy poskytují své základy pro komponenty platformní. Vrstva PaaS (Platform-as-a-Service) obsahuje datové sklady, komponenty datové integrace či hostované BI platformy. Poslední vrstva SaaS (Software-as-a-Service) je posledním článkem a jedná se tedy převážně o nástroje, se kterými dojdou do styku koncoví uživatelé. Jedná se tedy o nástroje určené k analýze dat, jejich vizualizace a vytváření reportů. V dnešní době dodavatelé BI řešení nabízí ekosystém, který pokrývá všechny vrstvy a znamená to tedy řešení tzv. ready to deploy, která jsou připraveny se spustit a nasadit do provozu v rámci podniku ve velmi krátkém čase. Nutno podotknout ovšem, že s rostoucím podílem cloudu a cloudových služeb roste i závislost na dodavatelích těchto řešení a neustále se omílá otázka

Odkazy

Související dokumenty

Já sám pracuji ve zdravotnictví, ale pokud Výbor ČPS ČLK bude i nadále zastávat ná- zor, že mimo oblast zdravotnictví nelze u nás legálně psychoterapii provádět –

[r]

11. Je-li hodnota pravd ě podobnosti náhodného jevu rovna jedné, nazýváme jev:.

Pokud k takovému odmítnutí Steinbock přistupuje, pak proto, že sleduje i jiný, druhý význam „přímosti“ morálních emocí: některé emoce jsou morální přímo v tom

Bylo předneseno 14 příspěvků, které se týkaly rozporů mezi proklamovanými transformačními cíli a realitou současné české

Že dva roky stará nahrávka Švábenského opravdu souvisí s aktuální kauzou, potvrdily serveru iROZHLAS.cz dva důvěryhodné zdroje blízké vyšetřování. Sociolog a

The aim of my thesis is to compare the attitudes toward the pre-school-children integration among managers of nursery schools in the city of Č eské Bud ě jovice, parents of

Obce tvoří nedílnou součást seniorské politiky v systému veřejné správy, avšak mají poně- kud jinou úlohu nežli krajské úřady a ústřední orgány státní správy.