• Nebyly nalezeny žádné výsledky

Detail zadavatele – výsledky jednoho z devíti ukazatelů

3.3 Shrnutí

V této kapitole bylo detailně prozkoumáno a popsáno 16 zdrojů, které nabízejí data či informace z oblasti veřejných zakázek. Oblast veřejných zakázek byla prozkoumána právě z toho důvodu, jelikož se jedná o realizaci veřejných projektů. Ve zdrojích byla hledána veškerá data a informace, které mohou obohatit výstupy, jež vzniknou v kapitole Demonstrace využití implementovaného řešení.

K automatizovanému těžení a následnému zpracování dat, čemuž se věnují následující kapitoly, jsou vybrány zdroje, které splňují tato kritéria:

1. Obsahují relevantní data.

2. Data jsou poskytována formou datových sad či aplikačních rozhraní.

3. Jsou dostupné zdarma a bez nutnosti využití zkušebních verzí služeb, kde lze data získat.

Jako primární zdroj dat k účelům provedení jejich analýzy byl vybrán Registr smluv. Tato data lze získat přímo z Registru smluv nebo prostřednictvím služby Hlídač státu. Jelikož Hlídač státu tato data již zpracovává, tedy převádí smlouvy do strojově čitelné textové podoby i včetně skenovaných dokumentů, kterých je až 30 %, odpadá tak potřeba převodu PDF dokumentů a provádění OCR analýzy. Z tohoto důvodu budou data získána prostřednictvím REST API Hlídače státu. Z Registru smluv budou použity pouze údaje potřebné jako vstupní parametry sloužící ke konstrukci dotazů do Hlídače státu.

Doplňkovým zdrojem dat je Administrativní registr ekonomických subjektů za účelem potřeby rozlišovat projekty z oblasti ICT prostřednictvím údajů o ekonomických činnostech jednotlivých subjektů.

Kromě výše zmíněných vybraných zdrojů však lze případně využít i některé ostatní, které se objevily výše v této kapitole. Vzhledem k definovanému rozsahu a pracnosti této diplomové práce jsou však zbylé zdroje ponechány jako možnost případného budoucího rozšíření a navázání na tuto práci. Za zmínku stojí zejména zdroj Rozza, kde lze získat například doplňkové dokumenty k veřejným zakázkám. Dále datové sady MMR obsahující faktury a objednávky. Za zmínku také stojí DATLAB KONTROLA, který se věnuje oblasti projektového řízení rizik. Tento zdroj však nesplňuje druhé kritérium výběru. Z tohoto důvodu by byla potřeba vývoje web scraperu. Dalším problémem je, že není možné odlišit zakázky z oblasti ICT.

Relevantním zdrojem dat byl taktéž Informační systém o veřejných zakázkách. Ten však bohužel během zpracování této diplomové práce změnil své webové stránky a původní datové sady popsané výše již nejsou k dispozici.

Výsledný seznam zdrojů odkud budou čerpána data:

• ARES

• Hlídač státu

• Registr smluv

4 Návrh řešení

Prvním krokem k dosažení dílčího cíle DC4 je vytvořit návrh výsledného řešení, respektive systému, jenž odpovídá hlavnímu cíli této diplomové práce. Kapitola se skládá z podkapitol Architektura a Použité nástroje. V podkapitole Architektura je popsán návrh systému za použití podnikové architektury užitím rámce ArchiMate. Následně jsou v podkapitole Použité nástroje popsány technické komponenty, z nichž se výsledný systém skládá. Během návrhu vycházel autor této práce z prací uvedených v kapitole Rešerše zdrojů. Bruckner (2019) v článku Design of the technological architecture for PUMPIT project popisuje solution architekturu, která zde byla částečně využita pro výběr nástrojů v navrhovaném řešení. Na základě toho byly zvoleny nástroje Docker, pro konfiguraci a nasazování systému, Elasticsearch jako databáze smluv a Kibana jako datově analytický nástroj pro tvorbu výsledného reportu. Dále v článku The Process of Unit Price Extraction from Public Sector Contracts autoři Bruckner a Vencovský (2020b) popisují způsob selekce smluv ze sektoru ICT, tedy prostřednictvím ekonomické klasifikace NACE, jíž lze ověřovat dotazováním do informačního systému MFČR ARES. Tento postup selekce ICT smluv byl zakomponován i zde.

4.1 Architektura

Tato kapitola se věnuje popisu navrhovaného řešení prostřednictvím podnikové architektury. Dříve byl užíván pojem technologická architektura, jež se věnovala správnému uspořádání technologií v systém zpracovávající data. Následně se technologická architektura rozšířila o další prvky, konkrétně o aplikace a informace pro podporu byznysu.

Tento pohled je označován jako IS/ICT architektura. Aktuálně je však kladen důraz na soulad mezi byznysem, požadavky a IS/ICT. Spojení IS/ICT architektury a byznys architektury je označováno pojmem podniková architektura. Jedním z přínosů podnikové architektury je možnost pružného a agilního implementování změn systému. Byznys požadavky tak mohou být zaváděny rychleji. (Buchalcevová a Gála 2008)

Byznys, respektive byznys požadavek v této práci představuje cíl definovaný v kapitole 1.1.

Využití podnikové architektury zde hraje roli při návrhu nově vznikajícího systému, který bude schopen těžit a analyzovat data z vybraných zdrojů. Současně výstupy této kapitoly umožní čtenářovi porozumět výslednému systému a pomohou mu tak v případě, kdy se rozhodne na tuto práci navázat a dále jí rozvíjet.

Nástrojem pro tvorbu architektur jsou rámce. V kontextu podnikové architektury je rámec modelem nebo náčrtem, který poskytuje logickou strukturu, v rámci níž jsou vytvářeny a vzájemně propojovány výstupy podnikové architektury. Rámců podnikové architektury existuje celá řada, například Zachmanův rámec, TOGAF, ArchiMate, DODAF, MODAF a další. (EAdirections, LLC 2013)

Pro účely namodelování architektury v této kapitole byl vybrán rámec ArchiMate verze 3.132. Jedná se o modelovací jazyk, který poskytuje jednotné znázornění diagramů popisujících podnikovou architekturu. Modely tohoto jazyka jsou složením prvků(elementů) a vztahů.

Charakteristika jednotlivých prvků a vztahů, které se vyskytují v modelech níže je popsána v Příloha A:. Jádrem rámce ArchiMate jsou dimenze vrstev a aspektů. Obrázek 11 níže zobrazuje tabulku o devíti buňkách tvořených těmito dvěma dimenzemi, které klasifikují jednotlivé prvky (elementy) jazyka. Dimenze vrstev je tvořena třemi vrstvami byznys, aplikační a technologickou vrstvou. Dimenze aspektů je rozdělena na prvky pasivní struktury, chování a aktivní struktury. ArchiMate definuje jednotlivé vrstvy následovně:

Byznys vrstva – Popisuje byznys služby nabízené zákazníkům. Tyto služby jsou realizovány prostřednictvím byznys procesů vykonávaných byznys aktéry.

Aplikační vrstva – Popisuje aplikační služby podporující byznys a aplikace, jimiž jsou realizovány.

Technologická vrstva – Popisuje technologické služby potřebné k provozování aplikací. Jedná se o služby zpracování, úložišť a komunikace. Součástí popisu je hardware, systémový software, materiály či sítě.

Jednotlivé aspekty jsou definovány takto:

Pasivní struktura – Reprezentuje objekty, na kterých je vykonáváno chování/aktivita (informace, datové objekty, fyzické objekty).

Chování – Reprezentuje prvky zachycující dynamiku podniku (procesy, funkce, události a služby).

Aktivní struktura – Reprezentuje strukturální prvky tvořící aktivitu (byznys aktér, aplikační komponenta atd.). (The Open Group 2019)