• Nebyly nalezeny žádné výsledky

Hlavní práce73784_xvobp00.pdf, 3.5 MB Stáhnout

N/A
N/A
Protected

Academic year: 2022

Podíl "Hlavní práce73784_xvobp00.pdf, 3.5 MB Stáhnout"

Copied!
117
0
0

Načítání.... (zobrazit plný text nyní)

Fulltext

(1)

Vysoká škola ekonomická v Praze

Fakulta informatiky a statistiky

Strategie práce s daty v mezinárodní společnosti

DIPLOMOVÁ PRÁCE

Studijní program: Aplikovaná informatika Studijní obor: Informační management

Autor: Bc. Petr Vobecký

Vedoucí diplomové práce: prof. Ing. Petr Doucek, CSc.

Praha, prosinec 2020

(2)

Prohlašuji na svou čest, že jsem diplomovou práci vypracoval samostatně a s použitím uvedené literatury.

Bc. Petr Vobecký V Praze, dne 7. 12. 2020

(3)
(4)

Poděkování

Rád bych na tomto místě poděkoval všem, kteří se podíleli nebo významně ovlivnili tuto práci. V první řadě děkuji prof. Ing. Petru Douckovi, CSc za vedení diplomové práce. Rád bych poděkoval také kolegům, se kterými jsem měl tu čest konzultovat diplomovou práci a kteří mě inspirovali k hlubšímu zájmu o problematiku zpracování dat a business intelligence, děkuji jmenovitě Bc. Ivaně Bartošové, Ing. Tomášovi Fišerovi a Ing. Malice Rakhmanové.

Největší dík ovšem patří mým rodičům, kteří mě nepřestávali podporovat během mého snažení o úspěšné ukončení univerzitního studia.

(5)
(6)

Abstrakt

Teoretická část předkládané diplomové práce pojednává o konceptech business intelligence, datového skladu a datového jezera a procesech nahrávání dat s nimi souvisejícími. Cílem práce je vytvoření seznamu aktivit vedoucích k naplnění stanovených strategických cílů vývoje BI řešení společnosti GE Aviation Czech, s.r.o. V praktické části je na základě analytických schůzek se zástupci oddělení analyzované společnosti zhodnocen současný stav BI řešení. Stávající stav BI je zhodnocen pomocí SWOT analýzy, souhrnného zhodnocení vybraných kritérií a úrovně dílčích oblastí. Následně je navržen cílový stav a strategické cíle a aktivity rozvoje BI za účelem naplnění cílového stavu. V závěru práce je také popsán realizovaný projekt, který pod vedením autora přispěl k rozvoji BI řešení k cílovému stavu.

Klíčová slova

Business intelligence, datový sklad, datové jezero, data, ETL, ELT

JEL klasifikace

C8, C88

(7)

Abstract

The theoretical part of the presented diploma thesis deals with the concepts of business intelligence, data warehouse and data lake and the processes of uploading data related to these concepts. The aim of the work is to create a list of activities leading to the fulfilment of the set strategic goals of the development of BI solution in the company GE Aviation Czech, s.r.o. In the practical part the current state of the BI solution is evaluated based on analytical meetings with representatives of the analysed company. Subsequently, the target state and strategic goals and activities of BI development are proposed in order to meet the target state. At the end of the work there is also described the implemented project, which under the guidance of the author contributed to the development of BI solution closer to the target state.

Keywords

Business intelligence, Data warehouse, Data lake, data, ETL, ELT

JEL Classification

C8, C88

(8)

Obsah

Úvod ... 12

Cíle práce a přínos práce ... 12

Metodika práce a její limity ... 13

1 Historie Business Intelligence ... 15

2 Business intelligence ... 17

3 Datový sklad ... 20

3.1 Úvod do DWH ... 20

3.2 Proces nahrání dat do DWH ... 22

4 Data Lake ... 23

4.1 Úvod do Data Lake ... 23

4.2 Proces nahrání dat do Data Lake ... 24

5 DWH a Data Lake v kontextu GEAC ... 26

6 Zhodnocení stávajícího stavu BI ... 30

6.1 SWOT analýza současného BI prostředí ... 31

6.2 Souhrnné zhodnocení úrovně současného BI prostředí ... 32

6.2.1 Model zralosti BI řešení ... 32

6.2.2 Souhrnné zhodnocení současného stavu BI v GEAC ... 36

6.3 Zhodnocení současné úrovně dílčích oblastí BI ... 38

6.3.1 Po oblastech BI ... 39

6.3.2 Po funkčních oblastech ... 53

7 Návrh cílového stavu BI ... 81

7.1 Představa cílového stavu BI... 81

7.2 Cílový stav BI ... 81

7.2.1 Význam BI ... 84

7.2.2 KPI ... 84

7.2.3 Rozsah dat ... 85

7.2.4 Reporty ... 87

7.2.5 Řízení BI, sponzor, financování ... 89

7.2.6 Architektura ... 90

7.2.7 Datová kvalita ... 92

8 Strategické cíle BI a aktivity k jejich naplnění ... 93

8.1 Zmapování rozsahu BI a vytvoření plánu rozvoje reportů ... 93

8.1.1 GAP analýza reportů ... 93

(9)

8.1.2 Report katalog ... 94

8.1.3 Vývoj metadat a reportů ... 95

8.2 Implementace dat z nových datových zdrojů ... 95

8.2.1 Detailní analýza informačních potřeb ... 95

8.2.2 Analýza a revize dat ve zdrojových systémech ... 96

8.2.3 Design datového modelu ... 96

8.2.4 Design logických mapování ... 97

8.2.5 Vývoj ETL ... 97

8.3 Definice struktury klíčových ukazatelů výkonosti ... 98

8.3.1 Definice konzistentní hierarchie strategických KPI ... 98

8.3.2 Rozpad strategických KPI na taktická a operativní ... 99

8.4 Zvýšení kvality a unifikace interpretace dat ... 99

8.4.1 Standardizace vizualizace dat, návrhu a tvorby reportů ... 99

8.4.2 Schvalování a certifikace reportů ... 99

8.4.3 Vytvoření Business slovníku ... 100

8.5 Získání podpory pro implementaci rozvojových požadavků ... 100

8.5.1 BI strategie pro rozšíření DWH/BI v GEAC ... 100

8.5.2 Informování klíčových uživatelů o konceptu a funkcionalitě DWH/BI ... 101

8.5.3 Informování top managementu o konceptu a funkcionalitě DWH/BI ... 101

8.6 Nastavení transparentní BI služby ... 102

8.6.1 Ustanovení kompetenčního centra BI ... 102

8.6.2 Nastavení transparentní a otevřené komunikace vůči BI uživatelům ... 103

9 Realizovaný projekt naplňující strategické cíle BI ... 104

9.1 Cíl a rozsah projektu ... 104

9.2 Průběh projektu ... 106

9.3 Zhodnocení projektu ... 108

Závěr ... 110

Použitá literatura ... 112

Seznam obrázků ... 115 Přílohy ... I Příloha A: Šablona pro analýzu po funkčních oblastech ... I Příloha B: Šablona pro aktivitu k naplnění strategického cíle ... I

(10)

10

Seznam zkratek

APEX Oracle Application Express. Rozhraní využívané jako převodový můstek pro ETL proces do DWH.

BICC Kompetenční centrum business intelligence

BR Business rule

DQ Data Quality

DWH Datový sklad

D-0 Používá se v souvislosti s aktuálností dat. V tomto případě se jedná o data aktuálního dne, tedy data s méně než jednodenním zpožděním nahrávání.

Předpokládá se nahrávání vícekrát za den nebo nahrávání dat s minimálním zpožděním.

D-1 Používá se v souvislosti s aktuálností dat. V tomto případě se jedná o data aktuálního dne mínus jeden den, tedy data s jednodenním zpožděním nahrávání.

eBS Oracle ERP systém e-Business Suite

ELT Extract – Load – Transofm. Načtení a zpracování dat ze zdrojového systému do datového skladu, popřípadě do Data Lake úložiště.

ETL Extract – Transform – Load. Načtení a zpracování dat ze zdrojového systému do datového skladu, popřípadě do Data Lake úložiště.

FDM Field Data Management

FDMS Field Data Management System

GAAP Generally accepted accounting principles GAP Gap Analysis Program

GEAC GE Aviation Czech GEUP GE Unison Poland GEUR GE Unison Romania

GL General Ledger - účetní kniha

INV Inventory

LT Lead time

MIS Manažerský informační systém

(11)

11

OBI Oracle Business Intelligence – reportingové řešení pro MIS OBIEE Oracle Business Intelligence Enterprise Edition

ODI Oracle Data Integrator – Oracle ETL řešení ODBC Open Database Connectivity

ONV Oznámení o neshodě výrobku OLAP Online Analytical Processing OLTP Online Transaction Processing OTD On-time delivery

P2P Procure to pay

PO Purchase order

PPM Parts per million

PLT Professional leadership team – skupina vedoucích jednotlivých oddělení oddělení.

QA Quality Assurence

QBR Quartely Business Review

RMA Součást reklamačního procesu. RMA slouží k identifikaci reklamovaného zboží.

SCD1 přepisovaný číselník SCD2 plně historizovaný číselník SCD3 srovnávací číselník

SQE Supplier Quality Engineering

TAT Doba od podání požadavku na výrobu po jeho úspěšné dokončení UAT Uživatelské aplikační testy

WIP Work in process

(12)

12

Úvod

Již od osmdesátých let jsme svědkem rostoucí pozornosti vůči významu dat v rámci soukromých a veřejných organizací. Díky správné strategii a přístupu k datům je subjekt, respektive její management a ostatní zaměstnanci, schopný provádět strategické kroky a operativní aktivity, jejichž podstata je postavena na základě dat, neboli exaktního vyjádření skutečnosti. V současnosti se s tímto jevem setkáváme ve spojitosti s termínem data-driven company1.

Vývoj oboru datové vědy se od ukládání, zpracování a interpretace posunul až po dnešní predikce budoucího stavu a je klíčem ke zvýšené konkurenceschopnosti a vyšší přidané hodnotě organizací a celé naší společnosti.

Hlavní motivací k výběru tématu je autorovo působení ve společnosti GE Aviation Czech, s.r.o. v rámci mezinárodního DevOps týmu, který má zodpovědnost za vývoj a podporu ERP systému Oracle e-Business Suite a Oracle Business Intelligence Enterprise Edition na pozici projektového manažera/BI analytika. Z důvodu absence strategického vývoje tohoto řešení nabyl autor dojmu, že detailní analýza současného stavu s návrhem aktivit vedoucích ke stavu cílovému je příležitost pro zainteresování vrcholného managementu a ostatních uživatelů BI řešení ve společnosti.

Cíle práce a přínos práce

Cílem předkládané diplomové práce je vytvoření seznamu aktivit vedoucích k naplnění stanovených strategických cílů vývoje BI řešení společnosti GE Aviation Czech, s.r.o.

Zmiňovaný cíl práce je naplněn díky dosažení níže popsaných dílčích cílů práce:

• Uvedení technologií datového skladu a datového jezera do kontextu analyzované společnosti,

• zanalyzování současného stavu BI společnosti,

• stanovení cílového stavu BI na základě výstupů analytických schůzek se zástupci společnosti,

• stanovení strategických cílů BI a aktivit k jejich naplnění.

Přínosná bude práce především pro pracovníky v oblasti datové analýzy, produktové manažery BI řešení a top management pro případ implementace nástrojů pro strategickou práci s daty, nebo zlepšení aktuálního stavu této problematiky ve společnosti. Jelikož je

1 společnost založená na datech

(13)

13

práce postavena na základě analýzy aktuálního stavu konkrétního obchodní společnosti, může být přínosná pro iniciaci programu a jednotlivých projektů pro rozvoj současného řešení analyzované společnosti.

Tato práce může být přínosná pro následující okruhy stakeholderů společnosti:

Klíčoví uživatelé jednotlivých datových oblastí v rámci GEAC – klíčoví uživatelé z definovaných oblastí v rámci organizace (Finance, Sourcing, Sales, Materials & Planning, Quality, Technologie, Montáž a zkušebna, Manufacturing, Inventory, Engineering, EHS, Facility, IT). Tito uživatelé se účastnili analytických schůzek,

správci zdrojových systémů2 a stávajícího BI řešení – jedná se o zástupce IT oddělení a případně externích zdrojových systémů,

management – zástupci středního a vyššího managementu, kteří jsou klíčoví pro prosazení směru vývoje na úrovni celé organizace.

Metodika práce a její limity

Práce je rozčleněna do dvou částí. V první části je popsána teoretická rovina práce s daty a technologie obou řešení, které v současné době dominují na trhu na základě rešerše volně dostupných informačních zdrojů a interních dokumentů společnosti GE. V druhé části se práce věnuje detailní analýze stávajícího řešení a aktivitám vedoucím k naplnění strategických cílů BI.

V této části práce je provedena analýza všech oblastí současného BI řešení – identifikace požadavků i problémů na analytických schůzkách s klíčovými uživateli třinácti oddělení společnosti. Při vypracování analýzy jsou zohledněny zkušenosti a znalosti externího dodavatele Neit Consulting a interního IT týmu. Na základě těchto postupů je identifikován aktuální stav zralosti BI a cílová úroveň zralosti BI. Pro dosažení cílové úrovně jsou stanoveny strategické cíle a konkrétní aktivity pro jejich naplnění. Součástí práce je také příklad reálně dokončeného projektu vedoucího k naplnění strategických cílů vývoje BI.

Součástí této práce není detailní analýza informačních potřeb na úrovni atributů business entit, ale globální analýza na úrovni business entit a metrik. Detailní analýza požadavků a informačních potřeb musí být součástí cílového řešení, které bude případně z této práce vycházet.

Omezením této práce je malý počet účastníků analytických schůzek v rámci organizace. Díky tomu jsou prezentovány výsledky pouze na základě pohledu vybrané množiny zástupců jednotlivých oddělení s přihlédnutím na zkušenosti IT oddělení. Práce disponuje s Data maturity management modelem, který je postaven na základě zkušeností a postupů

2 eBS, docházkový systém atd.

(14)

14

soukromé společnosti Neit Consulting, s.r.o. V případě použití jiného modelu by závěry práce a jednotlivé kroky k naplnění strategických cílů společnosti byly odlišné.

(15)

15

1 Historie Business Intelligence

V této kapitole jsou popsány definice pojmů, které jsou klíčové pro pochopení principů a metodik, které jsou v rámci této práce použity.

Koncept datových skladů a business intelligence řeší primárně úkol, jak zajistit správné informace těm správným lidem ve správný čas, aby mohli rychle a kvalitně rozhodnout či provést pracovní úkol tím nejlepším možným způsobem.

Business Intelligence je disciplína, která si klade za cíl najít správná a kvalitní data, obohacovat je, čistit, analyzovat a nakonec prezentovat svým interním a externím zákazníkům3 pro potřeby jejich efektivní práce například sledování výkonu, informační podpora při rozhodování, plánování, podpora operativní a obchodních činností atd.

Základy BI byly položeny v 80. letech minulého století jako reakce na čím dál hlasitější požadavky na analytické zpracování velkého množství nevyužitých firemních dat. Cílem byla podpora analytických, plánovacích a rozhodovacích procesů. Výsledkem byla o několik let později formulace základních principů a vytvoření několika prací na toto téma, například práce prof. Rockarta, E. F. Codda a dalších. Také se objevily první komerční produkty v oblasti zpracování dat a jejich multidimenzionálního uložení, které byly označovány jako EIS4.

První datové sklady, jak je známe dnes, vznikaly v první polovině 90. let minulého století.

Hlavním důvodem rozvoje datových skladů byl rychlý růst objemů dat v informačních systémech, zejména v ERP. S rostoucím množstvím historických dat si organizace uvědomovaly, že v těchto datech jsou skryty informace, které by mohly zásadně pomoci při řízení firmy a plánování jejího dalšího rozvoje. Zatím však nebyly k dispozici efektivní prostředky, které by tato historická a často v různých systémech se nalézající data zvládly zpracovávat a vyhledávat souvislosti, které by se daly využít v řízení.

Aby mohla být historická data zpracovávána, bylo nutné vyřešit následující problémy:

Data byla uložena v různých aplikacích, a tedy i fyzicky na různých místech, takže hledání souvislostí pro řídící a rozhodovací činnosti nebylo možné.

Stávající systémy nebyly způsobilé k uchovávání historických dat a pravidelnému nahrávání dat z interních či externích zdrojů.

V systémech nebyla zabudována podpora pro analýzu dat a tvorbu manažerských reportů.

3 manažerům, analytikům i řadovým zaměstnancům, klientům, orgánům státní správy atd.

4 Executive Information Systems

(16)

16

Řešením těchto problémů vznikl koncept datových skladů5. Tento koncept byl postaven na pracích R. Kimballa a B. Inmona. Došlo k postupnému přechodu od analýz nad transakčními databázemi6 k analýzám nad multidimenzionálními databázemi7.

Od 90. let se rozvíjelo komplexní řešení datových skladů, datových tržišť, EIS a data miningu. Dalším krokem bylo provázání BI se CRM8 a dalšími systémy.

5 Data Warehouse

6 OLTP

7 OLAP

8 Customer Relationship Management

(17)

17

2 Business intelligence

Business Intelligence a další související pojmy je koncept, který se v různých významech používá již od 80. let 20. století. Jednou z prvních definic pojmu Business Intelligence je ta z roku 1989 od Howarda J. Dresnera, analytika společnosti Gartner Group, který ho popsal jako „sadu konceptů a metod určených pro zkvalitnění rozhodnutí firmy“ (Novotný, 2005).

BI je prostředí, ve kterém uživatelé přijímají data, která jsou spolehlivá, konzistentní, snadno dostupná a časově určená. S těmito daty jsou uživatelé schopni provádět analýzy, které jim přinášejí poznání, jak na tom firma momentálně obchodně je a jak na tom bude v blízké budoucnosti. Hlavním úkolem BI je monitorování finančního a provozního zdraví organizace pomocí reportů, analýz a dashboardů.

„Business intelligence můžeme chápat jako ucelený a efektivní přístup k práci s firemními daty, který má vliv na správnost strategických rozhodnutí, a tím i na obchodní úspěch společnosti. V současném vysoce konkurenčním prostředí představuje informovanost jednu z hlavních konkurenčních výhod. Tato výhoda spočívá ve schopnosti efektivně využít data nashromážděná ve firmách k tvorbě informací a znalostí, na základě kterých můžeme reagovat na rychle se měnící požadavky trhu a našich zákazníků.“ (Panec, 2003) Dle Pance (Panec, 2003) je základem BI proces přeměny zdrojových, zpravidla transakčních, dat na znalosti, s jejichž pomocí jsou následně přijímána správná rozhodnutí.

Prostřednictvím tohoto procesu jsou data čištěna, integrována, transformována do využitelné podoby a následně analyzována a dále zpracovávána.

Pro prezentaci dat uživatelům se používají analytické aplikace, které využívají data z datových skladů či tržišť. Tyto BI analytické aplikace zahrnují nástroje pro podporu rozhodování, dotazování a reporting, OLAP, statistické analýzy, prognózy a data mining.

Jak již bylo řečeno, pojem BI se používá od 80. let 20. století a v průběhu let se chápání tohoto pojmu vyvíjelo a rozšiřovalo podle aktuálních potřeb. Pro ilustraci posunu chápání pojmů souvisejících s Business Intelligence slouží následující obrázek.

(18)

18

Obrázek 1 - Vývoj BI a jeho budoucnost (Zdroj: Wayne, 2016)

Posun v chápání Business Intelligence se vyvíjel hlavně v závislosti na tom, jak se jednotlivé organizace a osoby využívající BI naučily využívat a konzumovat informace. Následuje popis jednotlivých dekád BI evoluce:

Data Warehousing (1980–2000)

Cíl: Integrovat data z různorodých zdrojových systémů, shromáždit data organizace na jednom místě v rámci datového skladu a umožnit uživatelům reporting nad těmito daty.

Základní otázka: Co se stalo?

Primárně se jednalo o tvorbu strategických datových skladů, které jsou subjektově orientovány s uplatněním principu „jedné verze pravdy“.

Business analytics (1980–2000)

Cíl: Umožnit z nestrukturovaných dat, které má organizace k dispozici, vytěžit informace na úrovni predikcí budoucího stavu, které povedou např.

ke konkurenční výhodě, k řešení aktuálního problému nebo k přehodnocení aktuální business strategie.

Základní otázka / princip: Co se stane? / Predikce.

Jedná se o hledání určitých trendů/predikcí v rámci nestrukturovaných dat typu senzorická data z technologií (stroje, auta atd.), diskusní fóra, sociální sítě (Facebook, Twitter, Linked In), behaviorální data atd.

Business Intelligence (2000–2005)

Cíl: Využití integrovaných dat uložených v datových skladech pro reporting s cílem zaměřit se na analýzu příčin některých identifikovaných jevů v minulosti.

Základní otázka / princip: Proč se to stalo? / Reporting.

(19)

19

Principem bylo vytvořit data marty pro jednotlivé business oblasti pro analýzu příčin s orientací na sledované business problematiky s inkrementálním dodáním, které zajistí rychlost dodávky analytických podkladů pro koncové uživatele s minimem rizika chybných dat pro analytické výstupy.

Performance management (2005–2010)

Cíl: Umožnit sledovat klíčovým uživatelům KPI v čase pro zjištění plnění definovaných cílů organizace se zaměřením na co nejvyšší aktuálnost dat v BI.

Základní otázka / princip: Co se děje teď? / Analýzy.

Posun od informativních statických reportů k dashboardům (panelům) a scorecard, které mají za cíl kontinuálně sledovat vývoj KPI a jejich vazbu na plnění cílů organizace. Dalším trendem je snaha o real-time reporting, tedy o co nejvyšší aktuálnost dat v BI reportech vedoucí až k tomu, že se aktualizovaná data v BI reportech objevují s minimálním zpožděním.

(20)

20

3 Datový sklad

3.1 Úvod do DWH

Datový sklad poskytuje data pro Business Intelligence analytické nástroje, které zprostředkovávají reporty a dashboardy pro podporu rozhodování klíčovým uživatelům organizace.

Všeobecně přijímaná definice datového skladu, kterou ve své knize Building the Data Warehouse (Inmon, 2002) uvedl W. H. Inmon zní:

„Datový sklad je podnikově strukturovaný depozitář subjektově orientovaných, integrovaných, stálých a časově rozlišených historických dat použitých na získávání informací a podporu rozhodování. V datovém skladu jsou uložena atomická a sumární data.“

Podrobnější vysvětlení pojmů, které tvoří definici:

Subjektová orientace – standardně jsou data produkčních databází strukturována podle aplikací, které je využívají, např. aplikace pro evidenci zákazníků, skladová aplikace atd. V datovém skladu jsou data kategorizována podle subjektu, kterým může být např. zboží, zákazník, zaměstnanec atd.

Data o zákazníkovi jsou tedy v datovém skladu pouze jednou, na rozdíl od aplikačně orientovaného přístupu, kde se může stát, že zákazník bude několikrát uložen v aplikačních databázích.

Integrovanost – data jsou ukládána do datového skladu jen jednou, jsou tedy zpracovávána v rámci celého podniku, a ne pouze v rámci oddělení.

Časová variabilita – záznam v datovém skladu je přesně určený v čase.

Záznam má buď časovou známku nebo je časově definován datem transakce, což umožňuje analýzu historických dat.

Stálost – v produkčních databázích se záznamy vkládají, modifikují i mažou.

Naproti tomu v datovém skladu se obvykle nemění ani neodstraňují, jen se v pravidelných intervalech přidávají nové záznamy.

Paulraj Ponniah (Ponniah, 2001) definuje datový sklad z funkčního hlediska jako informační prostředí které:

Poskytuje integrovaný a úplný pohled na firemní data.

Usnadňuje využití historických dat pro rozhodování.

Umožňuje provádění podpory rozhodování bez zatěžování provozních systémů.

Poskytuje konzistentní informace.

Představuje flexibilní a interaktivní zdroj strategických informací.

R. Kimball (Kimball, 2002) shrnuje požadavky na datový sklad v těchto bodech:

(21)

21

Datový sklad musí umožnit snadnější dostupnost firemních dat. Toho může být dosaženo, pokud data budou pro uživatele jasně a intuitivně uspořádána a bude mít k dispozici uživatelsky příjemnou analytickou aplikaci s odpovídající dobou odezvy.

Datový sklad musí prezentovat firemní data konzistentně. Předpokladem jsou jasně definované popisy dat dostupné uživatelům a vysoká kvalita integrace dat z provozních systémů.

Datový sklad musí být přizpůsobivý a připravený na změny.

Datový sklad musí být zabezpečen, aby chránil firemní data. Datové sklady obsahují důvěrná data o zákaznících, transakcích atd., a proto musí být přístup k těmto datům pečlivě sledován.

Datový sklad musí sloužit jako základ pro zlepšení rozhodovacích procesů.

Jestli má být datový sklad považován za úspěšný, musí ho přijmout uživatelé, aktivně ho využívat a podílet se na jeho dalším rozvoji.

Data Warehousing můžeme definovat jako proces pro shromáždění a řízení firemních dat s cílem získání jednoduchého nebo detailního pohledu na procesy9 uvnitř firmy. Za zdroje mohou být považována data z interních systémů, relace mezi databázovými objekty, soubory, externí zdroje nebo objektové databáze. Je důležité si uvědomit, že Data Warehousing není produkt, ale proces.

Obrázek 2 - ilustrace DWH (Zdroj: Schalmo, 2018)

DWH se tak používá především pro celofiremní reporting, ke kterému je nutné prezentovat data doménově specifická a operativní reporting z důvodu lepší kvality dat a metadat definovaných při ETL procesu.

9 nebo jejich část

(22)

22

3.2 Proces nahrání dat do DWH

Samotný proces nahrání dat má specifické kroky, které zaručují nejlepší praxi, a díky tomu ideální výsledky pro dlouhodobě udržitelný datový sklad. Tento proces lze považovat za základní předpoklad pro kvalitu dat v DWH.

Obrázek 3 - ETL proces (Zdroj: Eckstein A., 2019) ETL proces lze stručně popsat následujícími fakty:

K extrakci dat dochází ze zdroje.

K transformaci dochází použitím sady pravidel pro přípravu dat pro načtení.

Pravidla zahrnují překlad, očistu, agregaci, spojování, odvozování atd.

Data se načítají do cílové databáze.

Běžně se používá pro úložiště provozních dat, datový trh nebo datový sklad.

(23)

23

4 Data Lake

4.1 Úvod do Data Lake

Zjednodušeně lze Data Lake popsat jako úložiště, které obsahuje velké množství nezpracovaných dat v nativním formátu, dokud nejsou upraveny pro potřeby uživatele a jím vyžadovaného pohledu na jejich agregaci. Ukládají se zde data z více externích a podnikových zdrojů dat. Z externích dat je možné jmenovat například data z letového provozu, aktuální stav a předpověď počasí nebo údaje z obchodních rejstříků pro účely sourcingu.

V rámci dokumentace GE (A. Melanie, 2019) můžeme naleznout následující čtyři hlavní výhody Data Lake technologického řešení.

1) Kompatibilní a cenově dostupné ukládání a vyhledávání dat

Tato technologie podporuje požadavky na řádné zabezpečení a správu dat v souladu s regionálními zákony o ochraně dat a se smlouvami o datech se zákazníky. Umožňuje vám čelit výzvám neustále se měnícího prostředí dodržování předpisů, které, pokud nebude provedeno správně, může mít vážné finanční důsledky.

2) Redundance dat, trvanlivost a škálovatelnost

Data Lake je postaven na platformě, která využívá Amazon Web Services pro spolehlivé a škálovatelné cloudové výpočetní služby.

3) Pokročilá analytika, business inteligence a strojové učení

Aviation Data Lake podporuje robustní systém označování metadat, který pomáhá uživateli efektivně se dotazovat napříč různorodými zdroji a formáty dat. Tento systém značení umožňuje dotazovat se na data pro různé obchodní potřeby.

4) Snadná agregace dat

Díky této technologii se účinně shromažďují údaje z různých zdrojových systémů a formátů na jednom místě. Tyto data je možné mezi s sebou propojovat a získat díky tomu unikátní pohledy na základě preferencí uživatele.

(24)

24 Obrázek 4 - ilustrace Data Lake (Zdroj: Schalmo, 2018)

Data Lake se používá především pro datovou investigativu a analytiku, která využívá doménově nezávislá data v nativním formátu ze zdroje. Díky datové investigativě lze mezi business procesy a aktivitami jednotlivců nalézt spojitosti, které mohou pomoci v předcházení rizik a vyšší výkonnosti společnosti.

4.2 Proces nahrání dat do Data Lake

Obrázek 5 – ELT proces (Zdroj: Eckstein A., 2019) ELT proces lze stručně popsat následujícími fakty:

Jedná se o variaci extraktu, transformace, načtení

Nezpracovaná data načtená přímo do cílového úložiště.

Transformace a zpracování dat probíhá v cílové databázi.

Tento process je rychlejší načítání díky surovým datum.

Běžně se používá pro datové jezero.

(25)

25

Obrázek 6 - Proces zpracování dat v Data Lake (Zdroj: Schalmo, 2018)

V prvním kroku se identifikují zdrojové systémy, které jsou dle cost benefit analýzy přínosné pro rozvoj do Data Lake technologie. Především se jedná o stavební kameny společnosti jako je ERP systém, docházkový systém, atd. Jako již bylo uvedeno může se jednat také o systémy třetích stran, data o zákaznících, počasí a další. Dále se data zkopírují ze zdrojových systémů do úložiště. Tento krok se vyznačuje velkou flexibilitou, ale na druhou strana nejsou tyto data možná okamžitě využít, tak jako u DWH, kdy jsou data indexována a transformována do podoby, která je pro BI vizualizační nástroj, či jakoukoli jinou aplikační vrstvu, rozpoznatelná.

Je důležité zmínit, že v kroku „Explore data connections“ je nezbytné disponovat kontextem k požadovaným otázkám, potažmo odpovědím, které z dat vyplynou. Bez business kontextu a dovednosti data interpretovat nemají tato data žádnou přidanou hodnotu.

Příklad následného spojení zdrojových tabulek v nativním formátu k vytvoření požadovaného výstupu lze vidět na obrázku č. 7.

Obrázek 7 - Názorná ukázka procesu spojení jednotlivých tabulek v Data Lake (Zdroj: Rogers, 2019)

(26)

26

5 DWH a Data Lake v kontextu GEAC

Ve společnostech GEAC je datový sklad vyvíjen a udržován společností Neit Consulting.

Veškeré změny, které je třeba provést za účelem rozšíření dat, je nutné provést prostřednictvím tohoto dodavatele.

Využití Data Lake technologie je pro českou pobočku General Electric dostupné z hlediska licencí, ale vývoj jednotlivých reportů vyžaduje lidské zdroje se specifickými znalostmi, kterými samotná pobočka GEAC nedisponuje.

Business uživatelé GEAC nemají znalost těchto dvou technologií a jejich využití. Pro efektivní práci a využití potenciálu obou přístupů a týmu datových analytiků, je nutné porozumět základním principům těchto přístupů.

V současné době zaměstnanci preferují z důvodu uživatelsky přívětivějšího rozhraní Data Lake, správně řečeno technologii Data Lake s aplikační vrstvou Spotfire. Z důvodu absence technického pohledu konzumentů reportingových výstupu se často tyto pojmy zaměňují.

V praxi tak můžeme být svědkem požadavků na reporting v Data Lake technologii pouze z důvodu prezentační vrstvy.

V rámci GEAC se jako aplikační vrstva Business Intelligence používá Oracle Business Intelligence Enterprise Edition. Pro uživatele není na první pohled patrné, že za vizualizací je zpracování dat, a že přístupy ke zpracování dat prostřednictvím datového skladu a datového jezera se liší a jsou určeny pro různé případy použití.

Zjednodušený proces pro pochopení business uživatelů je znázorněn na obrázku č. 8.

Obrázek 8 - DWH vs Data Lake (Zdroj: Rakhmanova, 2020)

Pro stanovení použití jednotlivých technologií je nutné položit si následující otázky:

Kdo bude analýzu využívat? Pouze GEAC zaměstnanci/manažeři napříč GE.

(27)

27

Jaký typ dat chce uživatel vidět? Data z Oracle eBS/data z jiných poboček GE/Excel

Jsou data, která chce uživatel reportovat v datovém skladu, který stojí za OBIEE?

Je možné nahrávat data do Data Lake?

Data Lake a Data Warehouse se liší ve způsobu zpracování a ukládání zdrojových dat. Každý případ použití je třeba analyzovat z různých hledisek, abychom byl zvolen přístup, který nejlépe vyhovuje potřebám uživatele a zároveň je nejefektivnější.

Důležitým faktorem pro využití Data Lake technologie je významná překážka tzv. „Export control“. U DWH technologie jsou data přítomná na serveru ve vlastnictví společnosti.

V případě Data Lake to tak není. Pro Data Lake se využívá cloudové úložiště AWS, které disponuje dostatečnou infrastrukturou pro nahrávání určeného objemu dat. Export control je omezení exportu citlivých dat mimo GE prostředí. Příkladem mohou být data týkající se vládních zakázek, armádních produktů, nebo například citlivých dat z personálního oddělení. Pro iniciaci nahrání dat do datového jezera je díky tomu nutné data označit, provést tzv. „tagging“.

Dříve než se data začnou poprvé nahrávat do datového jezera je důležité je označit následujícími typy značek.

Označování - značky správce

Každý soubor nahraný do datového jezera má následující informace na obrázku č. 9 o souboru bez ohledu na typ souboru nebo umístění nahrávání.

Obrázek 9 – Tagging, značky správce (Zdroj: Nyamor, 2020)

(28)

28 Označování - popisné značky

Popisné značky může přidat pouze Data Lake. Tyto značky přidávají tzv. indexery.

Například u všech nahraných obrázků načte Data Lake záhlaví, které se následně extrahuje a poté uloží jako popisné značky.

Obrázek 10 - Tagging, popisné značky (Zdroj: Nyamor, 2020) Označování - sémantické značky

Sémantické značky se přidávají při nahrávání souborů. Ty mohou být přidány uživatelem.

Na obrázku č. 11 je příklad značek, které jsou manuálně přidány prostřednictvím datového generátoru při nahrávání do DataLake.

Obrázek 11 - Tagging, sémantické značky (Autor: Nyamor, 2020)

Po označení dat následuje compliance proces, který validuje, jestli je možné tyto data nahrávat do cloudového řešení.

Na následujícím obrázku je zobrazen komplexní systém reportingového ekosystému společnosti. Toto schéma zobrazuje jiný BI nástroj než je využíván v GEAC.

(29)

29 Obrázek 12 - Data Lake přehled (Zdroj: Hilgeford, 2018)

Pro představu objemu dat a DevOps souvisejícím s Data Lake prostředím jsou na obrázku č. 13 zobrazeny základní metriky. Je nutné podotknout, že ode dne publikování z roku 2018 se objem dat zdvojnásobil. Obrázek má díky tomu vypovídající hodnotu z hlediska počtu vývojářů na objem dat, a také slouží pro představu o jaké řády objemu dat se v rámci GE Aviation jedná.

Obrázek 13 - Data Lake platforma v číslech (Zdroj: Aiswarya Radhakrishnan, 2020)

Krok transformace, který je třeba provést v Data Lake, lze vyvíjet za součinnosti korporátního týmu Data Lake. Backlog korporátního týmu je však tvořen nejen z požadavků GEAC, ale z poboček celého světa. Prioritizace jednotlivých změnových požadavků je díky tomu závislá na finančním přínosu pro společnost jako mezinárodního subjektu. Pobočky, které mají násobně více zaměstnanců, tak mají při stejném finančním nákladu z pravidla vyšší užitek, jelikož náklady na jednoho zaměstnance vůči benefitům jsou nižší. Další překážkou je výše zmínění export control, který znemožňuje více než 30% data nahrání do datového jezera. Díky těmto faktům se tato práce primárně věnuje strategii lokálního DWH, které není tak závislé na korporátním řízení práce s daty.

(30)

30

6 Zhodnocení stávajícího stavu BI

Základním vstupem pro zhodnocení stávajícího stavu byly analytické schůzky s klíčovými uživateli zodpovědnými za jednotlivé business oblasti v období od července 2020 do října 2020. Jednalo se o následující business oblasti:

Finance,

Sourcing,

Sales,

Materials & Planning,

Quality,

Technologie,

Montáž a zkušebna,

Manufacturing,

Inventory,

Engineering,

EHS,

Facility,

IT,

Human Resources.

Cílem těchto schůzek bylo zjistit aktuální stav BI v organizaci a identifikovat současné problémy a odchylky od “nejlepší praxe” se zaměřením na zjištění aktuálních požadavků jednotlivých oddělení na reporty a z nich vyplývající business dimenze a metriky.

Zhodnocení stávajícího stavu BI je v rámci této práce popsáno pomocí následujících nástrojů a metodik:

SWOT analýza - kapitola 6.1 SWOT analýza současného BI prostředí.

Model zralosti BI a související metodiky pro vyhodnocení stavu BI na úrovni celé organizace a na úrovni jednotlivých oblastí - 6.2.2 Souhrnné zhodnocení současného stavu BI v GEAC a 6.3 Zhodnocení současné úrovně dílčích oblastí BI.

Současná úroveň zralosti BI, která reprezentuje stav BI v GEAC, byla na základě metodiky určena na 2,9 z 6 možných bodů na úrovni divergentního BI.

(31)

31

Obrázek 14 - Zhodnocení současného stavu BI (Zdroj: Autor)

Toto souhrnné zhodnocení současného stavu BI v GEAC vychází z detailní analýzy na úrovni následujících oblastí:

Význam BI,

KPI,

rozsah dat,

reporty,

řízení BI, sponzor, financování,

architektura,

datová kvalita.

Detaily analýzy po oblastech jsou uvedeny v kapitole 6.3.1 Zhodnocení současné úrovně dílčích oblastí BI.

6.1 SWOT analýza současného BI prostředí

Stav BI prostředí byl na základě analytických schůzek zmapován a s použitím SWOT analýzy je strukturovaně prezentován. Jednotlivé faktory jsou důležité při iniciaci budoucích kroků a měly by být brány v potaz při stanovení cílů projektů za účelem rozšíření stávajícího řešení.

Cílem by měl být pozitivní či neutrální dopad na silné stránky systému při využití příležitostí, či zlepšení stránek slabých s důrazem na hrozby, které mohou být chápány jako rizika jednotlivých projektů.

Silné stránky Příležitosti

V současném řešení jsou vybudovány datové oblasti s hlavními atributy a metrikami na základě business procesů.

Datovým zdrojem je v tuto chvíli ERP systém, ve kterém jsou data v dobrém stavu,

automaticky očištěná od duplicit a uživatelé mají dobrý přehled o struktuře jednotlivých položek.

Infrastruktura využívaná k provozu BI řešení je dimenzována s vyšším výpočetním výkonem, je tedy připravena i pro případné rozšíření rozsahu datového skladu.

Rozšíření DWH BI řešení o moduly ERP, případně atributy, které současné řešení neobsahuje.

Rozšíření DWH BI řešení o data z dalších zdrojových systémů.

Zavedení pojmu jedné verze pravdy ve spojení s daty prezentovanými ze systému BI. Mitigace problému s prezentací dat s různými

hodnotami.

Vybudování důvěry uživatelů systému ke správnosti dat.

Nastavení správné jmenné konvence napříč organizací.

(32)

32

V případě nutnosti zvýšení výpočetního výkonu je infrastruktura škálovatelná díky využití cloudového řešení.

Partnerství společnosti s dodavatelem Oracle v rámci rámcové spolupráce. Hypercare v případě upgradu softwarového řešení atd.

Většina uživatelů BI nástroje jsou současně uživateli ERP nástroje eBS a jsou schopni strukturovaně přemýšlet o tom, co by chtěli/měli vidět v BI nástroji.

Management společnosti plně podporuje aktivity vedoucí k rozšíření aktuálního rozsahu BI řešení. S tím souvisí příprava pro rok 2021 v rámci rozpočtu pro tyto aktivity.

Automatizace rutinních aktivit pro reporting.

Zlepšení stávajících dashboardů, reportů a automaticky generovaných analýz.

Zlepšení stávající komunikace mezi IT oddělením a business uživatelem pro lepší podpůrnou činnost IT oddělení a zároveň pochopení business uživatelů omezení a možností využítí BI řešení.

Slabé stránky Hrozby

Chybějící strategie ke konzistentní práci s daty na úrovni pobočky.

Nedostatek kapacit IT oddělení pro rozvoj BI řešení, především na úrovni ETL vývojářů.

Absence Product ownera pro BI řešení, který by byl styčnou osobou pro business uživatele.

Nezastupitelnost uživatelů vytvářející reporty pro jednotlivé business entity.

Absence školení pro uživatele s cílem rozšířit/udržet know-how zacházení s BI nástrojem.

Chybějící datové oblasti pro specifické business procesy, které se prolínají napříč odděleními.

Nízká důvěra uživatelů v současnou vypovídající hodnotu dat v DWH BI řešení.

Ve většině případů není možné propojit datové oblasti z důvodu rozdílné granularity.

Absence snímků hlavních metrik – není možné sledovat trendy určitých klíčových ukazatelů.

Definice zkratek a výrazů použitých odlišnými odděleními se různí.

Slabá komunikace mezi představiteli

nadnárodního Data Lake řešení a IT oddělením

Nedostatečný důraz na vedení strukturované dokumentace k rozšíření DWH.

Možná situace vynaložení finančních nákladů na rozšíření datového skladu a následné využití Data Lake řešení v souladu s korporátními nařízeními pro sjednocení reportingu napříč pobočkami společnosti.

Z důvodu nedostatečných kapacit IT oddělení, je zde možnost výpadku IT teamu při odchodu zaměstnance.

V případě využití přímého spojení do

zdrojového systému, namísto DWH BI řešení – přetížení ERP systému a následný výpadek

Ztráta know-how obsluhy BI nástroje z důvodu nízkého počtu zainteresovaných

uživatelů/administrátorů.

Využití lidských zdrojů k opakovanému reportování namísto automatizace.

Specificita DWH řešení v kontextu korporátních

„best practice“. Je zde riziko nepochopení významu tohoto řešení v souvislosti s běžnou praxí v rámci společnosti.

Obrázek 15 - SWOT analýza BI prostředí (Zdroj: Autor)

6.2 Souhrnné zhodnocení úrovně současného BI prostředí

6.2.1 Model zralosti BI řešení

Na základě konzultací se společností Neit Consulting, s.r.o. je použit model zralosti BI řešení, který čerpá z 15 let zkušeností společnosti v působení v oblasti BI a DWH. Tento model obsahuje šest úrovní zralosti BI prostředí. Organizace se v daném okamžiku nachází právě v jedné úrovní zralosti. Mezi úrovní Osobní a Divergentní BI je tzv. Investiční bariéra a mezi Konvergentním a Strategickým BI konzultanti identifikovali tzv. Sémantickou bariéru. Jednotlivé úrovně zralosti jsou charakteristické mírou flexibility a standardizací

(33)

33

napříč organizací. Oba tyto aspekty jsou ilustračně znázorněny na obrázku č. 16.

Obrázek 16 - Ilustrace modelu zralosti BI (Zdroj: Autor)10

Následuje stručný popis jednotlivých úrovní modelu zralosti BI na základě konzultací se zástupci společnosti Neit Consulting:

Úroveň 1: Nulové BI

V organizaci se reportuje pouze na základě operativních reportů. Interpretace dat v reportu je schopen pouze její tvůrce a význam dat není nikde zaznamenán. Rozsah dat pro tyto reporty pochází z jednoho datového zdroje. Reporting může být v základní formě zpracován na papíře.

Úroveň 2: Osobní BI

Osobní BI je úroveň zralosti, při které si uživatelé společnosti vytváří na základě jejich vlastních požadavků analýzy. V tomto případě se data často prezentují pomocí nástroje Microsoft Excel, popřípadě jiným tabulkovým kalkulátorem. Sám autor si data exportuje z datového zdroje a upravuje je na základě svého pohledu. Díky tomu jsou analýzy se stejným účelem, které zpracovávají dva či více jedinců často odlišné a docházejí k jiným závěrům. Interakce mezi jednotlivými tvůrci analýz zde chybí a často dochází k duplicitě aktivity za účelem získání požadovaného výstupu.

Investiční bariéra

Investiční bariéra přestavuje překážku v překonání vývoje BI z Osobního do Divergentního.

V této fázi vývoje úrovně vyspělosti BI řešení je nutná iniciativa jednotlivců v prosazení investic do BI nástrojů a argumentace přínosů reportingových nástrojů pro zvýšení efektivity společnosti. Podpora vysokého managementu společnosti je klíčová, jelikož právě plánování rozpočtu je kompetencí hlavních představitelů organizace. Pro budoucí standardizaci je nutná informovanost nejen C-level managementu, ale i vedoucích oddělení,

10 Ilustrační obrázek není založen na exaktním vyjádření stavu faktorů flexibilita a standardizace

(34)

34

kteří díky tomu dostávají na starost další pole působnosti – reporting v rámci oddělení.

Finanční prostředky jsou ve vysoké míře potřeba i pro zvýšení kvality dat v systémech. Je nutné zavést validaci vstupů dat do primárních systémů, případně dalšího stupně na úrovni ETL. V této fázi narážíme především na neochotu uživatelů systému ke změně jejich flexibility a nezávislosti.

Úroveň 3: Divergentní BI

V případě divergentního BI dochází k ukládání, zpracování a očištění dat na úrovni business entit společnosti. Interakce jedinců v rámci oddělení zde přispívá k mitigaci duplicitních aktivit. Vedoucí oddělení je zodpovědný za reportování stavu jeho přidělených aktivit a obecného pohledu na aktivity celého oddělení. BI slouží k vysvětlení toho, co se stalo a návrhu preventivních opatření pro předcházení stejným úskalím.

Úroveň 4: Konvergentní BI

Ve 4. úrovni vyspělosti BI jde technologicky o vybudovaný Data Warehouse. Z pohledu obsluhy systému zde nalezneme uživatele, kteří fungují napříč organizací s cílem standardizovat reporting a fungovat v souvislostech aktivit. Na základě snahy o budování standardizace můžeme pozorovat například standardizaci v rámci vizuální podoby jednotlivých analýz, tak aby reportingu jednoho oddělení rozuměli i zástupci z jiné části organizace. V Konvergentním stupni BI se uživatelé dívají na aktuální stav vůči plánu, tak aby byli schopni dodržet plán a naplnili tak strategické cíle organizace. Reporty jsou vytvářeny na základě strategických cílů organizace a aktualizovány dle potřeby na základě změny strategických cílů. Uživatelé se díky BI informují o těchto změnách a velká část úsilí je automatizována.

Sémantická bariéra

Konzumentům analýz a dashboardů se v této fázi nedaří porozumět reportingu napříč organizací. Je proto nutné vytvořit „BI slovník“, který interpretuje prezentované metriky a data stejným způsobem pro širší publikum. Důležitá je také osvěta uživatelů ostatních oddělení s procesy souvisejícími s jejich business procesy, tak aby byli schopni uvažovat v souvislostech a data si vykládali správným způsobem „jednou verzí pravdy“. Datová pole by měla mít také názvosloví totožné se zdrojovými systémy, ideálně se tedy nejedná pouze o investigativu a aktivitu v rámci BI. Flexibilita řešení neustále klesá a uživatelé dle nich ztrácejí kontrolu nad správou reportingu.

Úroveň 5: Strategické BI

V tomto stavu vnímá top management organizace BI jako strategickou aplikaci. Všeobecně jsou přijímány návrhy pro aktivity argumentované na základě dat z BI nástroje. Napříč organizací jsou jednotlivé pojmy a metriky chápány stejným způsobem. Většina aktivit organizace je pokryta v souvislosti s datovým loadem a uživatelé jsou často schopni vytvářet složitější analýzy sami. Tým BI se rozšiřuje a strategické aktivity v rámci BI řešení se vedou jako projekty s centrálním řízením. IT oddělení obsahuje kompetenční centrum BI, které

(35)

35

zastřešuje všechny aktivity týkající se BI. BI prostředí dodržuje ve většině nejlepší praxi.

Procesy v rámci kompetenčního centra BI jsou nastavené a řízené. BI dodržuje nastavený release management, patch management, dobu dodání požadavků od uživatelů a know-how BI týmu i běžných uživatelů je na vysoké úrovni. Data v DWH jsou aktuální k poslednímu uzavřenému dni/směně.

Úroveň 6: Otevřené BI

V rámci otevřeného BI je velký důraz na co možná nejaktuálnější data k současné chvíli.

Datové loady jsou zpravidla automatizovány v rámci několika hodin. U stěžejních systémů a dat potřebných ihned ke zpracování se může jednat o minuty, například fronta práce.

Otevírá se možnost zaznamenávání dat skrz BI nástroj, v některých případech o zpětný zápis do datového zdroje. V rovině oddělení jsou pevně stanoveni klíčoví uživatelé, kteří jsou zodpovědnými osobami za reporting oddělení a šíří know-how napříč oddělením o stavu reportingu. Otevřené BI umožňuje partnerům společnosti v některých případech sdílet jednotlivé analýzy a vytváří tak hodnotu i partnerské organizaci.

Modely zralosti dle jiných společností

Model zralosti BI řešení dle společnosti Neit Consulting lze porovnat například s modelem zralosti BI a analytiky dle společnosti Gartner, kde můžeme vidět podobný pohled na danou problematiku. Tento model zralosti je rozdělen do pěti úrovní s absencí úrovně první, tedy Nulové BI.

Obrázek 17 - BI a analytický Maturity Model (Zdroj: Gartner, 2015)

(36)

36

6.2.2 Souhrnné zhodnocení současného stavu BI v GEAC

Pro zjištění aktuální zralosti BI prostředí použijeme multikriteriální model s 9 kritérii v rámci výše popsaného modelu zralosti BI:

Kritérium Popis

Zralost BI

Nulové Osobní Divergentní Konvergentní Strategické Otevřené

Význam BI

Jaký je význam BI pro společnost?

položka nákladů

tvorba reportů (zpravidla pro top

management)

podpora rozhodování na všech (převážně nižších) úrovních

vyhodnocení výkonnosti (minulého období)

nástroj jednotného chápání, nástroj dopředného plánování (prognózování) a řízení podle odpovědnosti

konkurenční výhoda

KPI

Jsou definované a sledované KPI?

Nedostatečně definované, omezeně používané

Individuálně definované, nekomunikovan é v rámci organizace

Částečně definované, komunikovan é v rámci oddělení

Dokumentované, komunikované v rámci organizace, periodicky měřené

Konzistentně

měřené a

komunikované Řídí business rozhodnutí a investiční strategii

Rozsah dat

Jaké procesy jsou BI pokryty?

jeden zdrojový systém z pohledu jednoho uživatele

procesy jednoho uživatele

procesy jednoho oddělení

procesy divize, příp. některé procesy celé společnosti/skupin y

všechny procesy celé

společnosti/skupin y

jako Strategické a navíc všechny interakce s okolím

Reporty

Jaké výstupy BI poskytuje?

statické operativní reporty

omezený počet specializovanýc h analýz s vysokou přidanou hodnotou

co se stalo a proč se to stalo

vizuální přehledy11 a srovnání s plánem

prognózy, simulace, what-if analýzy, analýzy chování

online přístup všech stakeholder ů, automatizac e procesů

Řízení BI Jak je BI

řízeno? nijak adhoc příkazy

lokální metodiky a (zpravidla neúplné) lokální standardy pro vývoj

globální projektová metodika, zavádění centrálních standardů vývoje

globální projektová metodika, globální všeobecně známé standardy, SLA

jako Strategické, ale SLA na úrovni mission- critical

Sponzor

Jak je sponzor zapojen do BI?

sponzor není definován

toleruje osobní náklady

odpovídá za náklady oddělení

účastní se schůzek, schvaluje a odpovídá za náklady divize

definuje cíle, schvaluje a odpovídá za celkové náklady BI

určuje požadované ROI, odpovídá za celkové náklady, ale především za výnosy z BI

11 grafy, semafory, budíky, dashboardy

(37)

37

Kritérium Popis

Zralost BI

Nulové Osobní Divergentní Konvergentní Strategické Otevřené

Financování

Jak je BI financováno

?

z provozních nákladů

z provozních nákladů, rozpočtů zdrojových systémů, školení a IT (dodatečné licence, support)

z rozpočtu oddělení nebo rozpočtu IT12

z rozpočtu divizí z korporátního rozpočtu13

z vlastních výnosů

Architektura Jakou architekturu BI má?

sestavy ze zdrojových systémů, nebo ad hoc SQL

lokální databáze14

oddělené datamarty

částečně integrovaný DWH

plně integrovaný DWH s jednotným slovníkem a BR

plně integrovaný DWH s daty near-online a podporou SOA

Datová kvalita

Jaké kvality dat BI dosahuje?

BI obsahuje data

nedůvěryhodn á, nedostatečně aktuální, neúplná. O interpretaci nejsou žádné spory.

data omezeně důvěryhodná, nedostatečně aktuální, neúplná. O interpretaci existují spory.

data lokálně důvěryhodná, lokálně aktuální, neúplná.

data globálně důvěryhodná, aktuální (D-1), neúplná. Často se (spíše neformálně) diskutuje nízká kvalita dat.

data globálně důvěryhodná, aktuální (D-1), úplná, jednotná.

DQ je pravidelně

měřena a

vyhodnocována jako Strategické, ale D-0

Obrázek 18 – Multikriteriální model zhodnocení stavu BI (Zdroj: Autor)

Postup vyhodnocení: u každého kritéria najdeme dle tabulky, případně i dle slovního popisu jednotlivých stupňů, nejvýstižnější stupeň zralosti BI a přidělíme mu 10 bodů. V případě nejednoznačnosti je možné rozdělit 10 bodů mezi sousední 2 stupně zralosti.15

Následně pro každé kritérium (i=1..9) sečteme:

Ki = body Nulové * 1 + body Osobní * 2 + body Divergentní *3 + body Konvergentní * 4 + body Strategické * 5 + body Otevřené * 6 (celkem maximálně 60 bodů)

Celkovou BI za pak celková BI zralost = SUM(Ki) / 70

Následující tabulka obsahuje hodnocení zralosti BI GEAC podle výše uvedené metodiky na základě analytických schůzek se zástupci klíčových uživatelů jednotlivých business oblastí a IT.

12 IT-driven BI

13 zpravidla samostatná kapitola, nebo podkapitola IT

14 Excel, Access

15 Příkladem může být situace, kdy je zahájeno budování business slovníku, pak pro kritérium Architektura přidělíme: Konvergentní 4, Strategické 1.

(38)

38

Nulové Osobní Divergentní Konvergentní Strategické Otevřené Body

1 2 3 4 5 6

Význam BI 3 7 27

KPI 4 6 36

Rozsah dat 2 8 28

Reporty 4 6 26

Řízení BI, sponzor,

financování 5 5 25

Architektura 2 8 38

Datová

kvalita 4 6 26

Celkem 2,9

Obrázek 19 - Hodnocení zralosti BI GEAC (Zdroj: Autor)16

Výsledná hodnota vždy leží v intervalu (1-6) a v zásadě přímo odpovídá stupni zralosti BI prostředí.17 Zvláštní pozornost zasluhují hodnoty mezi druhou a třetí úrovní, které se vyskytují v pásmu Investiční bariéry a mezi čtvrtou a pátou úrovní, což označujeme za Sémantickou bariéru.

Vysvětlující komentář k vyplněným úrovním hodnocení modelu zralosti BI je uveden v jednotlivých oblastech v kapitole 6.3 Zhodnocení současné úrovně dílčích oblastí BI.

6.3 Zhodnocení současné úrovně dílčích oblastí BI

Tato kapitola obsahuje zhodnocení současné úrovně dílčích oblastí BI na základě analytických schůzek se zástupci provozovatelů současného řešení18 a klíčových business uživatelů.

16 Čísla jsou zaokrouhlena na jedno desetinné místo.

17 1 = Nulové BI až 6 = Otevřené BI

18 zaměstnanci IT oddělení

Odkazy

Související dokumenty

Cílem této práce bylo porovnat současnou BI platformu vybrané společnosti s dalšími předními BI platformami na trhu za účelem doporučení vhodné BI platformy

Jsou zde analyzované jednotlivé možnosti využití jeho konkrétních funkcí při tvorbě manažerského reportingu a ukázky jejich zpracování na částech, které

Bakalářská práce na téma Využití SW nástroje Power BI pro manažerský reporting je zpracována kvalitně po stránce obsahové i formální a má všechny podstatné

Záleží pouze na vybraných č lenech delegace ne na tom, kdo byl vybrán jako první kdo

Pomocí Banachovy věty o pevném bodě dokažte Picardovu–Lindelöfovu větu (věta o existenci a jednoznačnosti řešení Cauchyovy úlohy, viz skriptum „Úvod do

[r]

To lze velice dobře použít v případě, že webová stránka má určitý konkrétní formát URL adres a umožňuje tak procházet i podstránky, na které by jinak byl horší

BitTorrent Sync je zajímavou alternativou ke cloudovým sluţbám. Funguje na principu P2P sítě. Není zde ţádný centrální server, na kterém by byla uloţena data.