Zadání diplomové práce

(1)

Pokyny pro vypracování

V kvalitních digitálních výškových modelech (DEM) s horizontálním rozlišením pod 10 m lze jasně identifikovat liniové struktury ochranných hrází, železnic a silnic v říčních nivách, které významně ovlivňují rozsah záplav. Tyto struktury jsou podstatné pro modelování povodňových rizik, proto je vhodné tyto struktury identifikovat a vektorizovat. Pro zpřesnění je možné využít satelitní obrazové snímky (např. mise Sentinel-2), zejména v případech, kdy je šířka stavby užší než rozlišení digitálního modelu terénu.

- Prozkoumejte dodané digitální výškové modely a satelitní snímky.

- Navrhněte metodu zarovnání dat.

- Prozkoumejte metody strojového učení vhodné pro zpracování dat (např. konvoluční neuronové sítě).

- Navrhněte metodu rozpoznávání a odhadu polohy liniových staveb v lokálně degradovaném výškovém modelu.

- Navrhněte a implementujte nástroj, který vytvoří reálnou, ale co nejspojitější vektorovou reprezentaci vedení korun hrází nebo náspů ve vhodném GIS formátu.

Zadání diplomové práce

Název: Identifikace ochranných hrází a náspů liniových staveb

Student: Bc. Jan Kostecký

Vedoucí: Ing. Petr Pulc

Studijní program: Informatika

Obor / specializace: Znalostní inženýrství

Katedra: Katedra aplikované matematiky Platnost zadání: do konce letního semestru 2020/2021

(2)

Diplomov´ a pr´ ace

Identifikace ochrann´ ych hr´ az´ı a n´ asp˚ u liniov´ ych staveb

Bc. Jan Kosteck´ y

Katedra aplikovan´a matematiky Vedouc´ı pr´ace: Ing. Petr Pulc

6. kvˇetna 2021

(3)

(4)

Podˇ ekov´ an´ı

Dˇekuji vedouc´ımu pr´ace Ing. Petru Pulcovi za pomoc.

(5)

(6)

Prohl´ aˇ sen´ı

Prohlaˇsuji, ˇze jsem pˇredloˇzenou práci vypracoval samostatnˇe a ˇze jsem uvedl veˇskeré pouˇzité informaˇcn´ı zdroje v souladu s Metodickým pokynem o dodrˇzo- ván´ı etických princip˚u pˇri pˇr´ıpravˇe vysokoˇskolských závˇereˇcných prac´ı.

Beru na vˇedom´ı, ˇze se na moji práci vztahuj´ı práva a povinnosti vyplývaj´ıc´ı ze zákona ˇc. 121/2000 Sb., autorského zákona, ve znˇen´ı pozdˇejˇs´ıch pˇredpis˚u.

V souladu s ust. § 2373 odst. 2 zákona ˇc. 89/2012 Sb., obˇcanský zákon´ık, ve znˇen´ı pozdˇejˇs´ıch pˇredpis˚u, t´ımto udˇeluji nevýhradn´ı oprávnˇen´ı (licenci) k uˇzit´ı této moj´ı práce, a to vˇcetnˇe vˇsech poˇc´ıtaˇcových program˚u, jeˇz jsou jej´ı souˇcást´ı ˇci pˇr´ılohou a veˇskeré jejich dokumentace (dále souhrnnˇe jen ”D´ılo“), a to vˇsem osobám, které si pˇrej´ı D´ılo uˇz´ıt. Tyto osoby jsou oprávnˇeny D´ılo uˇz´ıt jakýmkoli zp˚usobem, který nesniˇzuje hodnotu D´ıla a za jakýmkoli úˇcelem (vˇcetnˇe uˇzit´ı k výdˇeleˇcným úˇcel˚um). Toto oprávnˇen´ı je ˇcasovˇe, teritoriálnˇe i mnoˇzstevnˇe neomezené. Kaˇzdá osoba, která vyuˇzije výˇse uvedenou licenci, se vˇsak zava- zuje udˇelit ke kaˇzdému d´ılu, které vznikne (byt’ jen zˇcásti) na základˇe D´ıla,

úpravou D´ıla, spojen´ım D´ıla s jiným d´ılem, zaˇrazen´ım D´ıla do d´ıla souborného ˇci zpracován´ım D´ıla (vˇcetnˇe pˇrekladu) licenci alespoˇn ve výˇse uvedeném rozsahu a zároveˇn zpˇr´ıstupnit zdrojový kód takového d´ıla alespoˇn srovnatelným zp˚usobem a ve srovnatelném rozsahu, jako je zpˇr´ıstupnˇen zdrojový kód D´ıla.

V Praze dne 6. kvˇetna 2021 . . .. . .. . .. . .. . .. . .. . .

(7)

ˇCeské vysoké uˇcen´ı technické v Praze Fakulta informaˇcn´ıch technologi´ı

Tato práce vznikla jako ˇskoln´ı d´ılo na ˇCeském vysokém uˇcen´ı technickém v Praze, Fakultˇe informaˇcn´ıch technologi´ı. Práce je chránˇena právn´ımi pˇredpisy a mezinárodn´ımi úmluvami o právu autorském a právech souvisej´ıc´ıch s právem autorským. K jej´ımu uˇzit´ı, s výjimkou bezúplatných zákonných licenc´ı a nad rámec oprávnˇen´ı uvedených v Prohláˇsen´ı na pˇredchoz´ı stranˇe, je nezbytný sou- hlas autora.

Odkaz na tuto pr´aci

Kostecký, Jan. Identifikace ochranných hráz´ı a násp˚u liniových staveb. Di- plomová práce. Praha: ˇCeské vysoké uˇcen´ı technické v Praze, Fakulta in- formaˇcn´ıch technologi´ı, 2021.

(8)

Abstrakt

Ochranné hráze a náspy liniových staveb výraznˇe ovlivˇnuj´ı rozsah záplav.

Tato práce navrhuje postup, jak tyto struktury identifikovat z dat dálkového pr˚uzkumu Zemˇe a vektorizovat je do GIS formátu. Vstupem pro identifikaci jsou pˇredevˇs´ım digitáln´ı výˇskové modely; pro dalˇs´ı zpˇresnˇen´ı je pak otestováno pouˇzit´ı satelitn´ıch sn´ımk˚u mise Sentinel-2. K rozpoznán´ı ochranných hráz´ı a liniových staveb jsou vyuˇzity konvoluˇcn´ı neuronové s´ıtˇe.

Kl´ıˇcová slova Konvoluˇcn´ıneuronová s´ıt’, U-net, Sentinel-2, Digitáln´ıvýˇskový model

Abstract

Levees and embankments have a significant effect on the magnitude of flood- ing. This work deals with the identification of such structures and theirs conversion to vector GIS format. The inputs for the proposed algorithm are primarily digital terrain models; for further improvements, Sentinel-2 satellite images are used. For the detection of levees and embankments, an approach based on convolutional neural networks is proposed.

Keywords Convolutional neural net, U-net, Sentinel-2, Digital terrain model

(9)

(10)

Obsah

Uvod´ 1

1 Z´akladn´ı pojmy 3

1.1 Digitáln´ı výˇskové modely . . . 3

1.2 Souˇradnicov´e syst´emy . . . 4

1.3 Sentinel . . . 5

1.4 Formáty ukládán´ı dat . . . 6

1.4.1 Rastrov´e form´aty . . . 6

1.4.1.1 TIFF, GeoTIFF . . . 6

1.4.1.2 JPEG 2000 . . . 7

1.4.2 Vektorov´e form´aty . . . 7

1.4.2.1 GeoJSON . . . 7

1.4.2.2 Esri Shapefile . . . 8

1.5 Ochranné hráze a náspy liniových staveb . . . 9

2 Algoritmy 11 2.1 Strojov´e uˇcen´ı . . . 11

2.1.1 Pˇr´ıstupy k uˇcen´ı . . . 11

2.1.2 Rozdˇelen´ı uˇcen´ı podle c´ıle . . . 11

2.1.2.1 Regrese . . . 11

2.1.2.2 Klasifikace . . . 12

2.1.2.3 Shlukov´an´ı . . . 12

2.2 Algoritmy poˇc´ıtaˇcov´eho vidˇen´ı . . . 12

2.2.1 S´emantick´a segmentace . . . 12

2.3 Umˇel´e neuronov´e s´ıtˇe . . . 13

2.3.1 Perceptron . . . 13

2.3.2 V´ıcevrstv´a neuronov´a s´ıt’ . . . 14

2.3.2.1 Aktivaˇcn´ı funkce pro skryt´e vrstvy . . . 14

2.3.2.2 Aktivaˇcn´ı funkce pro v´ystupn´ı vrstvy . . . 15

(11)

2.4 Hlubok´e uˇcen´ı . . . 16

2.5 Konvoluˇcn´ı neuronov´e s´ıtˇe . . . 16

2.5.1 Konvoluˇcn´ı vrstva . . . 17

2.5.2 Pooling vrstva . . . 17

2.6 Architektury konvoluˇcn´ıch s´ıt´ı vhodn´ych pro s´emantickou segmentaci . . . 17

2.6.1 U-Net . . . 18

2.6.2 LinkNet . . . 18

2.6.3 PSPnet . . . 19

2.7 Vyhodnocen´ı ´uspˇeˇsnosti model˚u . . . 19

2.7.1 Matice z´amˇen . . . 21

2.7.2 Intersection over Union . . . 22

2.8 ´Uˇcelov´a funkce . . . 22

2.9 Morfologick´e operace . . . 22

2.9.1 Dilatace . . . 22

2.9.2 Eroze . . . 23

2.9.3 Skeletonizace . . . 23

3 Analýza problému a návrh ˇreˇsen´ı 25 3.1 Vstupn´ı data . . . 25

3.1.1 Digitáln´ı výˇskové modely . . . 25

3.1.2 Satelitn´ı sn´ımky . . . 26

3.1.3 Ochranné hráze a náspy liniových staveb . . . 26

3.2 Moˇzn´a ˇreˇsen´ı . . . 26

3.2.1 Morfometrick´e charakteristiky . . . 28

3.2.2 S´emantick´a segmentace . . . 28

3.3 Zvolen´e ˇreˇsen´ı . . . 28

4 Implementace 31 4.1 Pouˇzit´e knihovny . . . 31

4.2 Pˇredzpracov´an´ı vstupn´ıch dat . . . 32

4.2.1 Rasterizace vektor˚u ochrann´ych hr´az´ı . . . 32

4.2.2 Slouˇcen´ı satelitn´ıch sn´ımk˚u . . . 32

4.2.3 Pˇrevod na stejn´y SRS . . . 33

4.2.4 Prozkoum´an´ı pˇredzpracovan´ych vstupn´ıch dat . . . 33

4.3 Pˇrehled datov´ych sad . . . 34

4.3.1 Augmentace dat . . . 35

4.4 Trénován´ı CNN pro sémantickou segmentaci . . . 35

4.4.1 Parametry model˚u typu CNN . . . 35

4.4.2 Model zaloˇzený na digitáln´ım výˇskovém modelu . . . . 36

4.4.3 Model zaloˇzený na digitáln´ım výˇskovém modelu a satelitn´ıch sn´ımc´ıch . . . 36

4.5 N´avrh vlastn´ı CNN typu U-net . . . 38

4.5.1 Model zaloˇzen´y na DEM . . . 38 x

(12)

4.5.1.1 Zhodnocen´ı a interpretace v´ysledk˚u . . . 38

4.5.2 Model zaloˇzen´y na DEM a satelitn´ıch sn´ımc´ıch . . . 39

4.5.2.1 Zhodnocen´ı a interpretace v´ysledk˚u . . . 41

4.6 Predikce . . . 42

4.7 Post-processing . . . 43

4.7.1 Eroze . . . 43

4.7.2 Dilatace . . . 44

4.7.3 ´Uprava dle DEM . . . 44

4.7.4 Skeletonizace . . . 45

4.8 Transformace do vektorov´eho form´atu . . . 46

4.9 Zhodnocen´ı v´ysledk˚u . . . 46

4.10 N´avrhy na moˇzn´e budouc´ı vylepˇsen´ı . . . 47

Z´avˇer 51

Literatura 53

A Seznam pouˇzit´ych zkratek 57

B Obsah pˇriloˇzen´eho CD 59

(13)

(14)

Seznam obr´ azk˚ u

1.1 DEM vs. DSM [1] . . . 4

2.1 Pˇr´ıklad s´emantick´e segmentace [2] . . . 13

2.2 jednovrstv´y perceptron [3] . . . 14

2.3 Logistick´a funkce . . . 16

2.4 V´ıcevrstv´a neuronov´a s´ıt’ [3] . . . 16

2.5 Konvoluˇcn´ı neuronov´a s´ıt’ [4]. . . 17

2.6 Sch´ema plnˇe konvoluˇcn´ı neuronov´e s´ıtˇe [5]. . . 18

2.7 Pˇr´ıklad U-net architektury pˇrevzat´y z [6]. . . 19

2.8 Architektura LinkNet [7]. . . 20

2.9 Architektura PSPnet [8]. . . 20

2.10 Vlevo p˚uvodn´ı stav, vpravo stav po aplikaci dilatace. [9] . . . 23

2.11 Vlevo p˚uvodn´ı stav, vpravo stav po aplikaci eroze. [9] . . . 23

2.12 Vlevo p˚uvodn´ı stav, vpravo stav po skeletonizaci. [?] . . . 24

3.1 Vizualizace dat z digitáln´ıho výˇskového modelu . . . 26

3.2 RGB satelitn´ı sn´ımek . . . 27

3.3 Pˇr´ıklad vektor˚u hráz´ı a násp˚u liniových staveb . . . 27

4.1 Vlevo vektory ochranných hráz´ı, vpravo po rasterizaci. Jako pozad´ı je pouˇzit digitáln´ı výˇskový model. . . 32

4.2 Pˇr´ıklad pravdˇepodobnˇe nespr´avnˇe anotovan´ych dat . . . 34

4.3 Pr˚ubˇeh trénován´ı modelu zaloˇzeném na DEM. Trénováno na datechaustria 01,austria 02a otestováno na austria 03. . . 39

4.4 Úspˇeˇsná predikce modelu zaloˇzeném na DEM. Vlevo anotované hráze, uprostˇred predikce, vpravo DEM. . . 40

4.5 Neúspˇeˇsná predikce modelu zaloˇzeném na DEM. Vlevo anotované hráze, uprostˇred predikce, vpravo DEM. . . 40

4.6 Pr˚ubˇeh trénován´ımodelu zaloˇzeném na DEM a satelitn´ıch sn´ımc´ıch. Trénováno na datech austria 01, austria 02 a otestováno na austria 03. . . 41

(15)

4.7 Ukázka predikc´ı, kde jsou satelitn´ıch sn´ımky pˇr´ınosné. Zleva – ano- tovaná data, predikce vyuˇz´ıvaj´ıc´ısatelitn´ısn´ımky, predikce vyuˇz´ıvaj´ıc´ı pouze DEM, satelitn´ı sn´ımek, DEM. . . 42 4.8 Vlevo po ukázka predikce, kde kaˇzdý pixel nese hodnotu pravdˇepodobnosti,

ˇze se na jeho poloze nacház´ı hráz. Vpravo ukázka predikce po bi- narizaci. . . 43 4.9 Vlevo stav pˇred aplikac´ı eroze, vpravo po. . . 44 4.10 Vlevo stav pˇred aplikac´ı dilatace, vpravo po. . . 44 4.11 Vlevo problém, který m˚uˇze nastat pokud je koryto ˇreky úzké a

hráze jsou na obou stranách ˇreky. Vpravo opraven´ıodeˇcten´ım bod˚u, které jsou niˇzˇs´ı, neˇz jejich okol´ı. . . 45 4.12 Vlevo stav pˇred skeletonizac´ı, vpravo stav po skletonizaci. . . 45

xiv

(16)

Seznam tabulek

2.1 Matice zámˇen . . . 21 4.1 Model s pouˇzit´ım DEM jako vstupu, natrénován na datechaustria 01,

austria 02a otestován naaustria 03. . . 37 4.2 Model s pouˇzit´ım DEM jako vstupu, natrénován na datechpoland

a otestován naczech. . . 37 4.3 Model s pouˇzit´ım DEM a satelitn´ıch sn´ımk˚u Sentinel-2, natrénován

na datechaustria 01,austria 02a otestován na austria 03. . . 37 4.4 Model s pouˇzit´ım DEM a satelitn´ıch sn´ımk˚u Sentinel-2, natrénován

na datechpolanda otestován naczech . . . 37 4.5 Úspˇeˇsnost modelu zaloˇzeném na DEM, natrénovaném a otesto-

vaném na r˚uzných datech. . . 39 4.6 Úspˇeˇsnost modelu zaloˇzeném na DEM a satelitn´ıch sn´ımc´ıch, natrénovaném

a otestovan´em na r˚uzn´ych datech. . . 42

(17)

(18)

Uvod ´

Ochranné hráze a náspy liniových staveb (jako jsou silnice a ˇzeleznice) výraznˇe ovlivˇnuj´ı rozsah záplav, pˇredevˇs´ım pak v ˇr´ıˇcn´ıch nivách. Pro zpˇresnˇen´ı modelu rizik a rozsahu pˇr´ıpadných povodn´ı je velmi uˇziteˇcné m´ıt jako jeden ze vstup˚u povodˇnového modelu takovéto struktury ve vektorovém formátu. V digitáln´ıch výˇskových modelech (DEM) s vysokým horizontáln´ım rozliˇsen´ım je moˇzné liniové stavby pˇr´ımo rozpoznat. Ne vˇzdy je ovˇsem dostateˇcnˇe vysoké rozliˇsen´ı digitáln´ıho výˇskového modelu dostupné. V tom pˇr´ıpadˇe je moˇzné vyuˇz´ıt pro zpˇresnˇen´ı obrazové satelitn´ı sn´ımky poˇr´ızené satelity z mise Sentinel-2. Ty mohou pomoci pˇredevˇs´ım v tˇech pˇr´ıpadech, kdy jsou ochranné hráze ˇci náspy liniových staveb výraznˇe uˇzˇs´ı, neˇz rozliˇsen´ı DEM.

C´ılem této práce je prozkoumat metody identifikace vyvýˇsených liniových staveb v digitáln´ım výˇskovém modelu. A následnˇe ovˇeˇrit, zda je pˇr´ınosné jako dalˇs´ı vstup pro zpˇresnˇen´ı pouˇz´ıt obrazové satelitn´ı sn´ımky. Z takto identifiko- vaných staveb pak vytvoˇrit co nejspojitˇejˇs´ı, ale zároveˇn co nejv´ıce reálnou, vektorovou reprezentaci a následnˇe pˇrevést do vhodného vektorového GIS formátu.

V prvn´ıkapitole je poskytnut pˇrehled základn´ıch pojm˚u, kterým je potˇreba porozumˇet pro pochopen´ı problematiky. V druhé kapitole jsou definovány a rozebrány pouˇz´ıvané metody a algoritmy. Tˇret´ı kapitola se zabývá analýzou ˇreˇseného problému, pˇrehledem moˇzných metod ˇreˇsen´ıa volbou vhodného ˇreˇsen´ı pro tuto práci. ˇCtvrtá kapitola obsahuje popis procesu pˇredzpracován´ıdat, im- plementaˇcn´ı detaily a informace o trénován´ı model˚u. Dále je ve ˇctvrté kapitole ˇreˇsena úprava a vektorizace výstupu modelu a vyhodnocen´ı úspˇeˇsnosti celkové

´uspˇeˇsnosti.

(19)

(20)

Kapitola 1

Z´ akladn´ı pojmy

1.1 Digit´ aln´ı v´ yˇ skov´ e modely

Digitáln´ı výˇskové modely (digital elevation model, DEM) slouˇz´ı k popisu výˇskové struktury povrchu zkoumaného objektu, zpravidla (a také v této práci) jde o povrch Zemˇe.

Výˇskový model m˚uˇze být reprezentován napˇr´ıklad rastrovou mˇr´ıˇzkou s informac´ı o své poloze (zemˇepisné ˇs´ıˇrce a délce hranic mˇr´ıˇzky), kde kaˇzdý bod této pravidelné ˇctvercové mˇr´ıˇzky má pˇriˇrazenou informaci o nadmoˇrské výˇsce.

Jinou moˇznost´ı, jak reprezentovat výˇskový model, je vektorová metoda zvaná TIN (triangulated irregular network). V té je povrch objektu repre- zentován nepravidelnou s´ıt´ı trojúheln´ık˚u, kde má zemˇepisnou ˇs´ıˇrku, délku a elevaci definovaný kaˇzdý uzel s´ıtˇe. Tento typ výˇskového modelu ovˇsem nen´ı v této práci pouˇz´ıván a nebude dále diskutován.

Pˇri popisu digitáln´ıch výˇskových model˚u se bˇeˇznˇe uˇz´ıvaj´ı tˇri zkratky:

DEM Digital elevation model – Digitáln´ı výˇskový model DTM Digital terrain model – Digitáln´ı model terénu DSM Digital surface model – Digitáln´ı model povrchu

Napˇr´ıˇc literaturou nejsou tyto pojmy striktnˇe a jasnˇe definovány, nˇekdy je DEM (digital elevation model) pouˇz´ıván jako obecný výraz pro digitáln´ı výˇskový model, jindy je zase pouˇz´ıván jako synonymum k DTM (digital terrain model).

DTM obvykle popisuje nadmoˇrskou výˇsku terénu bez ˇclovˇekem umˇele vy- tvoˇrených staveb, ale i bez dalˇs´ıch pˇr´ırodn´ıch objekt˚u jako jsou napˇr´ıklad stromy. Nˇekdy je ovˇsem DTM obohacen vektorovými informacemi o poloze ˇrek, pˇr´ıkop˚u ˇci hˇreben˚u.

DSM (digital surface model) pak typicky popisuje výˇsku povrchu vˇcetnˇe staveb a vˇsech dalˇs´ıch objekt˚u, které odráˇz´ı svˇetlo.

Rozd´ıl mezi DTM a DSM ilustruje obr´azek 1.1

(21)

1. Z´akladn´ı pojmy

Obr´azek 1.1: DEM vs. DSM [1]

1.2 Souˇ radnicov´ e syst´ emy

Souˇradnicový systém (SRS – spatial reference system, nebo také CRS – coor- dinate reference system) definuje, jak se budou geografická data matematicky transformovat tak, aby byla s co nejmenˇs´ım zkreslen´ım zobrazitelná na ploché mapˇe.

Kaˇzdý souˇradnicový systém je urˇcen nˇekolika parametry:

• referenˇcn´ı tˇeleso – Slouˇz´ı jako aproximace popisu tvaru zemˇe, pˇr´ıpadnˇe prostoru na kter´y chceme polohovˇe odkazovat. Typicky jde o elipsoid, kouli ˇci rovinu.

• poloha nultého poledn´ıku – U globáln´ıch souˇradnicových systém˚u je vˇetˇsinou pouˇzit mezinárodn´ı nultý Greenwichský poledn´ık.

• typ zobrazen´ı referenˇcn´ı plochy na plochu rovinnou

• definice poˇc´atku, jednotky m´ıry a orientace syst´emu souˇradnic

Který souˇradnicový systém pouˇz´ıt závis´ı na tom, na jakou plochu na zemi chceme polohovˇe odkazovat. Napˇr´ıklad souˇradnicový systém S-JTSK (systém jednotné trigonometrické s´ıtˇe katastráln´ı), který vycház´ı z Kˇrovákova zobrazen´ı, má definované zobrazen´ı pouze pro body v ˇCeské a Slovenské republice 4

(22)

1.3. Sentinel a okol´ı, ale zato je pro definovaný prostor výraznˇe pˇresnˇejˇs´ı, neˇz systémy globáln´ı.

Vˇsechny bˇeˇznˇe pouˇz´ıvané souˇradnicové systémy jsou jednoznaˇcnˇe identi- fikované pomoc´ı SRID (spatial reference identifier). Napˇr´ıklad souˇradnicový systém S-JTSK s Greenwichským nultým poledn´ıkem má autoritou EPSG (European Petroleum Survey Group) pˇridˇelený kód 5514. D´ıky tomu je moˇzné v GIS datech pˇresnˇe specifikovat jaký souˇradnicový systém pouˇz´ıvaj´ı.

1.3 Sentinel

Sentinel je skupina mis´ı ESA (evropské kosmické agentury), které slouˇz´ı pro

´uˇcely programu Copernicus.

Program Copernicus obsahuje komplexn´ı systémy zajiˇst’uj´ıc´ı monitorován´ı zemˇe. Tyto systémy obstarávaj´ı sbˇer dat jak ze satelit˚u, jako v pˇr´ıpadˇe mise Sentinel, tak z pozemn´ıch stanic, letadel a dalˇs´ıch zdroj˚u.

Mise Sentinel je rozdˇelena do nˇekolika ˇcást´ı a kaˇzdá z nich sb´ırá r˚uzná data:

• Sentinel-1 – Dvˇe druˇzice, které monitoruj´ı jak pevninu, tak moˇre, oceány a stavy moˇrských led˚u.

• Sentinel-2 – Provád´ı multispektráln´ı sn´ımkován´ı krajiny, slouˇz´ı pˇreváˇznˇe k monitorován´ı zmˇen ploch a zmˇen jejich vyuˇzit´ı.

• Sentinel-3 – Mise m´a za ´ukol mˇeˇrit topografii povrchu moˇre, teplotu a barvu moˇre i zemˇe.

• Sentinel-4 – Nen´ı samostatná druˇzice, ale jde o modul um´ıstˇený na me- teorologické druˇzici MTG. Monitoruje stav atmosféry a plyn˚u, které jsou urˇcuj´ıc´ı pro kvalitu ovzduˇs´ı.

• Sentinel-5 – Monitoruje atmosféru, zjiˇst’uje jej´ıchemické sloˇzen´ı, provádˇen´ı mˇeˇren´ı souvisej´ıc´ı s vrstvou ozónu a UV záˇren´ım.

Pro tuto práci je zaj´ımavá pˇredevˇs´ım mise Sentinel-2, která poskytuje sn´ımky zemˇe ve 13 spektráln´ıch pásmech s prostorovým rozliˇsen´ım 10–60 m na pixel.

V nejjemnˇejˇs´ım rozliˇsen´ı 10 m na pixel jsou k dispozici pˇredevˇs´ım 3 pásma viditelného spektra, a to ˇcervené (se stˇredn´ı vlnovou délkou 665 nm), zelené (560 nm) a modré (490 nm). Pˇri vhodném sloˇzen´ı informac´ı z tˇechto pásem a atmosférické korekci vzniká takzvaný barevnˇe vˇerný sn´ımek (true color com- posite), který barevnˇe odpov´ıdá pozorován´ı lidským okem z úrovnˇe terénu.

(23)

1.4 Form´ aty ukl´ ad´ an´ı dat

V oboru GIS existuje mnoˇzstv´ı zp˚usob˚u jak ukládat geografická data. Jaký formát zvolit obvykle záleˇz´ı na tom, jak bude s daty dále nakládáno a v jakých softwarových nástroj´ıch s nimi budeme pracovat.

Formáty m˚uˇzeme v základu rozdˇelit na rastrové a vektorové. Rastrové formáty maj´ı fixn´ı mˇr´ıˇzku jednotlivých pixel˚u, u vektorových formát˚u jsou data uloˇzena jako popisy kˇrivek.

1.4.1 Rastrov´e form´aty 1.4.1.1 TIFF, GeoTIFF

Formát TIFF (Taged Image File Format) je jedn´ım z nejpouˇz´ıvanˇejˇs´ıch formát˚u rastrové grafiky v r˚uzných oborech, a to pˇredevˇs´ım kv˚uli své flexibilitˇe.

Tento formát umoˇzˇnuje ukládat jak s kompres´ı, tak bez komprese. Oproti jiným bˇeˇzným rastrovým formát˚um umoˇzˇnuje uloˇzit v´ıce samostatných obra- zových vrstev v jednom souboru.

Nevýhodou grafiky ve formátu TIFF je typicky vˇetˇs´ı velikost soubor˚u a omezená maximáln´ı velikost souboru na 4 GB.

GeoTIFF je rozˇs´ıˇren´ı formátu TIFF o geografická metadata. Pˇr´ıklad takových metadat poskytuje ukázka 1.1. D˚uleˇzitá je napˇr´ıklad informace o pouˇzitém souˇradnicovém systému (ˇrádky 5–17), velikost jednoho pixelu ve skuteˇcnosti v metrech (ˇrádek 19) a souˇradnice vˇsech roh˚u obrázku v pouˇzitém souˇradnicovém systému (ˇrádky 25–28).

Uk´azka 1.1: Metadata GeoTIFF.

1 D r i v e r : G T i f f / G e o T I F F 2 F i l e s : M o r a v a _ 1 0 m . tif

3 M o r a v a _ 1 0 m . tif . aux . xml

4 S i z e is 2501 , 7 4 2 6 5 C o o r d i n a t e S y s t e m is :

6 L O C A L _ C S [" S - J T S K _ K r o v a k _ E a s t _ N o r t h " , 7 G E O G C S [" S - J T S K " ,

8 D A T U M [" S y s t e m _ J e d n o t n e _ T r i g o n o m e t r i c k e _ S i t e _ K a t a s t r a l n i " , 9 S P H E R O I D [" B e s s e l 1 8 4 1 " , 6 3 7 7 3 9 7 . 1 5 5 , 2 9 9 . 1 5 2 8 1 2 8 0 0 0 0 3 3 , 10 A U T H O R I T Y [" E P S G " , "7 00 4" ]] ,

11 A U T H O R I T Y [" E P S G " , "6 15 6" ]] , 12 P R I M E M [" G r e e n w i c h " ,0] ,

13 U N I T [" d e g r e e " , 0 . 0 1 7 4 5 3 2 9 2 5 1 9 9 4 3 3 ] , 14 A U T H O R I T Y [" E P S G " , "4 15 6" ]] ,

15 A U T H O R I T Y [" E P S G " ,"5514"] , 16 U N I T [" m e t r e " ,1 ,

17 A U T H O R I T Y [" E P S G " , " 9 0 0 1 " ] ] ]

18 O r i g i n = ( - 5 5 4 1 9 7 . 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 , - 1 1 2 2 0 9 2 . 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ) 19 P i x e l S i z e = ( 1 0 . 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 , - 1 0 . 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ) 20 M e t a d a t a :

21 A R E A _ O R _ P O I N T = A r e a 22 I m a g e S t r u c t u r e M e t a d a t a :

6

(24)

1.4. Formáty ukládán´ı dat

23 I N T E R L E A V E = B A N D 24 C o r n e r C o o r d i n a t e s :

25 U p p e r L e f t ( - 5 5 4 1 9 7 . 5 0 0 , - 1 1 2 2 0 9 2 . 5 0 0 ) 26 L o w e r L e f t ( - 5 5 4 1 9 7 . 5 0 0 , - 1 1 9 6 3 5 2 . 5 0 0 ) 27 U p p e r R i g h t ( - 5 2 9 1 8 7 . 5 0 0 , - 1 1 2 2 0 9 2 . 5 0 0 ) 28 L o w e r R i g h t ( - 5 2 9 1 8 7 . 5 0 0 , - 1 1 9 6 3 5 2 . 5 0 0 ) 29 C e n t e r ( - 5 4 1 6 9 2 . 5 0 0 , - 1 1 5 9 2 2 2 . 5 0 0 )

30 B a n d 1 B l o c k = 1 2 8 x 1 2 8 T y p e = Float32 , C o l o r I n t e r p = G r a y 31 Min = 1 6 0 . 3 6 5 Max = 3 5 5 . 6 0 5

32 M i n i m u m = 1 6 0 . 3 6 5 , M a x i m u m = 3 5 5 . 6 0 5 , M e a n = 2 0 4 . 0 7 3 , S t d D e v = 2 5 . 9 8 9 33 N o D a t a V a l u e = - 3 . 4 0 2 8 2 3 4 6 6 3 8 5 2 8 8 6 e +38

34 M e t a d a t a :

35 S T A T I S T I C S _ M A X I M U M = 3 5 5 . 6 0 4 9 8 0 4 6 8 7 5 36 S T A T I S T I C S _ M E A N = 2 0 4 . 0 7 2 6 2 0 6 2 3 9 7 37 S T A T I S T I C S _ M I N I M U M = 1 6 0 . 3 6 5 0 0 5 4 9 3 1 6 38 S T A T I S T I C S _ S K I P F A C T O R X =1

39 S T A T I S T I C S _ S K I P F A C T O R Y =1

40 S T A T I S T I C S _ S T D D E V = 2 5 . 9 8 9 0 2 0 0 5 2 0 2 2

1.4.1.2 JPEG 2000

JPEG 2000 je následn´ıkem známého a rozˇs´ıˇreného formátu JPEG. Jsou u nˇej pouˇz´ıvány techniky komprese zaloˇzené na vlnkové kompresi [10], coˇz umoˇzˇnuje oproti p˚uvodn´ımu JPEG lepˇs´ı zachován´ı kvality grafiky i pˇri stejné velikosti souboru. Formát umoˇzˇnuje ale i bezztrátovou kompresi. Dle [10] byly pˇri tvorbˇe tohoto standardu ukládán´ı dat zohlednˇeny také poˇzadavky GIS ko- munity, d´ıky ˇcemuˇz je moˇzné vyuˇz´ıt rychlý pˇr´ıstup k prostorovým um´ıstˇen´ım, vˇetˇs´ı bitovou hloubku ˇci rozdˇelen´ı obrazu na nˇekolik dlaˇzdic s kterými je pak moˇzno pracovat nezávisle.

1.4.2 Vektorov´e form´aty 1.4.2.1 GeoJSON

GeoJSON je prostý textový formát pouˇz´ıvaj´ıc´ı syntaxi formátu JSON (Ja- vaScript Object Notation). Nad rámec tohoto formátu, který obsahuje pouze definice zápisu bˇeˇzných datových typ˚u a kolekc´ı, pak GeoJSON definuje nˇekolik typ˚u objekt˚u (napˇr. Position, Point, MultiPoint, LineString, MultiLineString, Polygon, MultiPolygon), které jsou bl´ıˇze specifikovány v [11].

Pro tuto práci je d˚uleˇzitý pˇredevˇs´ım typ objektu LineString (lomená ˇcára), jelikoˇz námi provádˇená vektorizace poskytuje právˇe ˇcárové segmenty. Objekt se pak definuje pomoc´ı seznamu souˇradnic bod˚u, které tuto lomenou ˇcáru tvoˇr´ı. Pˇr´ıklad takového zápisu je uvedený v ukázce 1.2.

Uk´azka 1.2: Uk´azka objektu typu LineString s definic´ı souˇradnic bod˚u.

1 {

2 " g e o m e t r y ": {

3 " t y p e ": " L i n e S t r i n g " ,

4 " c o o r d i n a t e s ": [[0 ,10] ,[1 ,11] , [2 ,11]]

(25)

5 } ,

6 " p r o p e r t i e s ": { 7 " n a m e ": " Hr ´a z "

8 }

9 }

1.4.2.2 Esri Shapefile

Otevˇrený formát pro ukládán´ı vektorových GIS dat Shapefile byl vyvinut spoleˇcnost´ı Esri a je podporován vˇetˇsinou komerˇcn´ıch i opensource nástroj˚u.

I proto je velmi popul´arn´ı volbou.

Formát je uloˇzen jako sada soubor˚u se stejným názvem ale r˚uznými pˇr´ıponami.

Povinn´e jsou tˇri soubory:

• .shp– hlavn´ı soubor, který obsahuje záznam o kaˇzdém objektu, uloˇzený jako seznam bod˚u, který tento objekt definuj´ı

• .shx – index záznam˚u v hlavn´ım .shp souboru, obsahuje 100 bajtovou hlaviˇcku a poté 8-bajtové záznamy o um´ıstˇen´ı kaˇzdého objektu v .shp souboru

• .dbf – dodateˇcn´e atributy ve form´atu dBase [12] pro objekty v .shp souboru

Kromˇe tˇechto tˇr´ı povinných soubor˚u je moˇzné pouˇz´ıt i nˇekolik dalˇs´ıch, volitelných:

• .prj – informace o souˇradnicovém systému a geodetickému datu [13], pˇr´ıklad v ukázce 1.3

• .cpg– specifikace k´odov´an´ı znak˚u v souboru.dbf

• .shp.xml– metadata ve form´atu XML

Ukázka 1.3: Informace k souˇradnému systému v Esri Shapefile.

1 P R O J C S [" S - J T S K _ K r o v a k _ E a s t _ N o r t h " , 2 G E O G C S [" G C S _ S _ J T S K " ,

3 D A T U M [" D _ S _ J T S K " , S P H E R O I D

4 [" B e s s e l _ 1 8 4 1 " , 6 3 7 7 3 9 7 . 1 5 5 , 2 9 9 . 1 5 2 8 1 2 8 ]

5 ] ,

6 P R I M E M [" G r e e n w i c h " ,0.0] ,

7 U N I T [" D e g r e e " , 0 . 0 1 7 4 5 3 2 9 2 5 1 9 9 4 3 3 ]

8 ] ,

9 P R O J E C T I O N [" K r o v a k "] ,

10 P A R A M E T E R [" F a l s e _ E a s t i n g " ,0.0] , 11 P A R A M E T E R [" F a l s e _ N o r t h i n g " ,0.0] ,

12 P A R A M E T E R [" P s e u d o _ S t a n d a r d _ P a r a l l e l _ 1 " ,78.5] , 13 P A R A M E T E R [" S c a l e _ F a c t o r " ,0.9999] ,

14 P A R A M E T E R [" A z i m u t h " , 3 0 . 2 8 8 1 3 9 7 5 2 7 7 7 7 8 ] ,

8

(26)

1.5. Ochranné hráze a náspy liniových staveb

15 P A R A M E T E R [" L o n g i t u d e _ O f _ C e n t e r " , 2 4 . 8 3 3 3 3 3 3 3 3 3 3 3 3 3 ] , 16 P A R A M E T E R [" L a t i t u d e _ O f _ C e n t e r " ,49.5] ,

17 P A R A M E T E R [" X _ S c a l e " , -1.0] , 18 P A R A M E T E R [" Y _ S c a l e " ,1.0] ,

19 P A R A M E T E R [" X Y _ P l a n e _ R o t a t i o n " ,90.0] , 20 U N I T [" M e t e r " ,1.0]

21 ]

1.5 Ochrann´ e hr´ aze a n´ aspy liniov´ ych staveb

Obecnˇe je liniová stavba definovaná jako stavba, kde podstatnˇe pˇrevaˇzuje délka nad výˇskou a ˇs´ıˇrkou. V kontextu této práce jsou pak zaj´ımavé pˇredevˇs´ım takové liniové stavby, které jsou oproti okol´ı vyvýˇsené, a v pˇr´ıpadˇe povodn´ı tvoˇr´ı pˇrekáˇzku pro rozléván´ı vody do okol´ı.

(27)

(28)

Kapitola 2

Algoritmy

2.1 Strojov´ e uˇ cen´ı

Strojové uˇcen´ı je podoblast´ı umˇelé inteligence (AI), která se zabývá schopnost´ı poˇc´ıtaˇce ˇreˇsit úlohy samostatnˇe bez explicitn´ıho naprogramován´ı.

2.1.1 Pˇr´ıstupy k uˇcen´ı

Algoritmy strojového uˇcen´ı m˚uˇzeme rozdˇelit na tˇri základn´ı podoblasti podle toho, jakým zp˚usobem je k uˇcen´ı pˇristupováno.

• Uˇcen´ı bez uˇcitele (Unsupervised learning) – jsou k dispozici pouze vstupn´ı data, nen´ı znám správný výstup. Nelze tedy obecnˇe a snadno urˇcit jaká je úspˇeˇsnost uˇcen´ı.

• Uˇcen´ı s uˇcitelem(Supervised learning) – ke vstupn´ım dat˚um je znám i správný výstup. Je tedy moˇzné vyhodnotit jak bylo uˇcen´ı úspˇeˇsné a podle toho dále upravovat parametry nauˇceného modelu.

• Zpˇetnovazebn´ı uˇcen´ı(Reinforcement learning) – v této technice stro- jového uˇcen´ı se uˇc´ı agent, kterému je umoˇznˇeno interagovat s okoln´ım prostˇred´ım a uˇcit se na základˇe svých chyb a zkuˇsenost´ı. Zat´ım co u uˇcen´ı s uˇcitelem by agent dostal seznam správných výstup˚u ke vstup˚um, u zpˇetnovazebn´ıho uˇcen´ı dostává bud’ pozitivn´ı nebo negativn´ı ohodno- cen´ı svých akc´ı, na jehoˇz základˇe provád´ı kroky dalˇs´ı.

2.1.2 Rozdˇelen´ı uˇcen´ı podle c´ıle 2.1.2.1 Regrese

C´ılem regrese je odhadnout funkci, která ke kaˇzdému vstupu pˇriˇrad´ı jednu výstupn´ı ˇc´ıselnou hodnotu, v obecném pˇr´ıpadˇe typicky reálné ˇc´ıslo.

(29)

2. Algoritmy

2.1.2.2 Klasifikace

Klasifikace spoˇc´ıvá v pˇriˇrazen´ı kaˇzdého vstupu k nˇejaké tˇr´ıdˇe. V pˇr´ıpadˇe binárn´ı klasifikace jde o tˇr´ıdy dvˇe. Pokud je tˇr´ıd v´ıce mluv´ıme pak o klasifikaci multinomiáln´ı.

2.1.2.3 Shlukov´an´ı

Shlukovac´ı algoritmy jsou jedn´ım z typických zástupc˚u algoritm˚u uˇcen´ı bez uˇcitele. Shlukován´ı rozdˇeluje vstupn´ı data do nˇekolika podmnoˇzin tak, aby si data v jedné podmnoˇzinˇe byla podle definované podobnostn´ıfunkce dostateˇcnˇe podobná a zároveˇn byla od dat v ostatn´ıch podmnoˇzinách dostateˇcnˇe rozd´ılná.

Tato podobnost je pak definov´ana nˇejakou metrikou nebo m´ırou podobnosti.

V´ıce o problematice shlukován´ı popisuji ve své bakaláˇrské práci [14].

2.2 Algoritmy poˇ c´ıtaˇ cov´ eho vidˇ en´ı

Poˇc´ıtaˇcové vidˇen´ı je jedn´ım z nových a rychle se vyv´ıjej´ıc´ıch obor˚u s velkým praktickým vyuˇzit´ım v mnoha oblastech. C´ılem je, aby byl poˇc´ıtaˇc schopný porozumˇet tomu, co obrazová data reprezentuj´ı, a z´ıskat z nich uˇziteˇcné informace. Pouˇzit´ı je opravdu ˇsiroké: mnoho lid´ı kaˇzdý den odemyká sv˚uj mobiln´ı telefon pomoc´ı funkce rozpoznáván´ı obliˇceje, coˇz je jen d˚umyslná aplikace metod poˇc´ıtaˇcového vidˇen´ı a binárn´ı klasifikace. D˚uleˇzitá je napˇr´ıklad i aplikace v medic´ınˇe, kdy jsou pomoc´ı poˇc´ıtaˇcového vidˇen´ı analyzována nebo zvýrazˇnována obrazová data z radiologických vyˇsetˇren´ı a je tak uˇsetˇren ˇcas lékaˇr˚u.

2.2.1 S´emantick´a segmentace

V oboru poˇc´ıtaˇcového vidˇen´ı je nˇekolik úrovn´ı, na kterých mohou poˇc´ıtaˇce analyzovat obrazová data. V pˇr´ıpadˇe sémantické segmentace jde o úroveˇn jednotlivých pixel˚u, kdy kaˇzdý pixel obrázku je klasifikován zvláˇst’. Pˇr´ıklad vstupu a výstupu takové segmentace je moˇzné vidˇet na obrázku 2.1.

Sémantická segmentace je metodou vyuˇz´ıvanou napˇr´ıklad k rozdˇelen´ı ob- razového satelitn´ıho sn´ımku povrchu Zemˇe do nˇekolika kategori´ı na základˇe vyuˇzit´ı dané plochy [15]. Jednou z kategori´ı mohou být komunikace (silnice, ˇzeleznice), coˇz jsou také liniové stavby, ovˇsem v této práci je dalˇs´ı poˇzadavek, aby takovéto stavby byly oproti okol´ı vyvýˇsené.

K samotné realizace sémantické segmentace je ˇcasto vyuˇz´ıváno pˇredevˇs´ım neuronových a konvoluˇcn´ıch neuronových s´ıt´ı, které jsou popsány dále.

12

(30)

2.3. Umˇel´e neuronov´e s´ıtˇe

Obrázek 2.1: Pˇr´ıklad sémantické segmentace [2]

2.3 Umˇ el´ e neuronov´ e s´ıtˇ e

Umˇelé neuronové s´ıtˇe (ANN – Artificial Neural Networks) jsou statistickým modelem, který je inspirován biologickými neurony a jejich propojen´ım. Základn´ı stavebn´ı jednotka neuronové s´ıtˇe je neuron[3], který na vstupu pˇrij´ımá vektor reálných ˇc´ısel a na výstupu vrac´ı jedno reálné ˇc´ıslo.

2.3.1 Perceptron

Nejjednoduˇsˇs´ım modelem umˇelé neuronové s´ıtˇe je perceptron pˇredstavený F.

Rosenblattem jiˇz roku 1957. Perceptron je moˇzné pouˇz´ıt napˇr´ıklad k binárn´ı klasifikaci dat, úspˇeˇsnˇe ale um´ı klasifikovat pouze mnoˇziny, které jsou lineárnˇe separovatelné. Tedy pˇri projekci dat do vhodné dvojdimenzionáln´ı roviny je schopen perceptron vyb´ırat pouze z rozhodovac´ıch hranic tvoˇrených pˇr´ımkou.

Schéma perceptronu je znázornˇeno na obrázku 2.2. Perceptron má na vstupu vektor reálných ˇc´ısel (x1, x2, ..., xn), uˇcen´ı perceptronu pak prob´ıhá pomoc´ı ladˇen´ı vektoru vah (w1, w2, ..., wn) a prahuw0. Vnitˇrn´ı potenciál perceptronu oznaˇcenýξ spoˇcteme vztahem 2.1.

ξ=w0+

n

X

i=1

wixi (2.1)

Výstupem perceptronu je pak hodnota funkce f(ξ). Této funkci se ˇr´ıká ak- tivaˇcn´ı funkce a v pˇr´ıpadˇe perceptronu je to funkce skoková jej´ıˇz pˇredpis je urˇcen vztahem 2.2.

f(ξ) =

(1 kdyˇzξ ≥0

0 kdyˇzξ <0 (2.2)

(31)

2. Algoritmy

Obr´azek 2.2: jednovrstv´y perceptron [3]

2.3.2 V´ıcevrstv´a neuronov´a s´ıt’

V´ıcevrstvá neuronová s´ıt’, bˇeˇznˇe oznaˇcována jako MLP (multilayer perceptron), vzniká propojen´ım nˇekolika vrstev neuron˚u (nebo perceptron˚u). Propojen´ı vzniká tak, ˇze výstup neuronu z jedné vrstvy slouˇz´ı jako vstup do jednoho nebo v´ıce neuron˚u ve vrstvˇe jiné (nebo i stejné v pˇr´ıpadˇe rekurentn´ıch s´ıt´ı).

Prvn´ı vrstvu oznaˇcujeme jako vstupn´ı, jej´ı jedinou úlohou je pˇredat vstupn´ı data do dalˇs´ıch vrstev s´ıtˇe které oznaˇcujeme jako skryté. Posledn´ı vrstvu s´ıtˇe z pohledu toku dat oznaˇcujeme jako výstupn´ı. Pokud neurony v rámci jedné vrstvy mezi sebou nemaj´ı ˇzádné propojen´ı a jsou naopak propojeny se vˇsemi neurony z vrstvy následuj´ıc´ı, mluv´ıme o plnˇe propojené dopˇredné neuronové s´ıti. Pˇr´ıklad takové topologie ukazuje schéma 2.4.

Oproti jednoduchému modelu perceptronu je v´ıcevrstvá neuronová s´ıt’

schopna klasifikovat mnoˇziny i pomoc´ı sloˇzitˇejˇs´ıch rozhodovac´ıch hranic, neˇz je pouze pˇr´ımka.

Jedn´ım z nejˇcastˇeji pouˇz´ıvaných algoritm˚u k uˇcen´ı takto zkonstruované neuronové s´ıtˇe je algoritmus zpˇetné propagace (back-propagation) [3], který vyˇzaduje, aby byla neuronová s´ıt’ jako funkce jejich parametr˚u, tedy vah, di- ferencovatelná. Toho doc´ıl´ıme vhodnou volbou aktivaˇcn´ıch funkc´ı.

2.3.2.1 Aktivaˇcn´ı funkce pro skryt´e vrstvy

U neuron˚u ve skrytých vrstvách se v souˇcasné dobˇe nejˇcastˇeji pouˇz´ıvá funkce RELU (Rectified Linear Unit) a jej´ı dalˇs´ı varianty (ELU, LeakyReLU).

14

(32)

2.3. Umˇel´e neuronov´e s´ıtˇe

• RELU

f(ξ) =

(ξ kdyˇzξ≥0

0 kdyˇzξ <0 (2.3)

• ELU

f(ξ) =

(ξ kdyˇzξ ≥0

α(e^ξ−1) kdyˇzξ <0 (2.4)

• LeakyReLU

f(ξ) =

(ξ kdyˇzξ≥0

αξ kdyˇzξ <0 (2.5)

• Hyperbolick´y tangens

f(ξ) = e^ξ−e^−ξ

e^ξ+e^−ξ (2.6)

2.3.2.2 Aktivaˇcn´ı funkce pro v´ystupn´ı vrstvy

C´ılem výstupn´ı vrstvy je transformace hodnot z pˇredchoz´ıch vrstev na hodnotu, která odpov´ıdá poˇzadovanému výstupu. Konkrétn´ı podobu aktivaˇcn´ı funkce vol´ıme podle toho, zda ˇreˇs´ıme úlohu regrese, binárn´ı klasifikace ˇci mul- tinomiáln´ı klasifikace.

• Binárn´ı klasifikace – výstupn´ı vrstva obsahuje jeden neuron, jako aktivaˇcn´ı funkce je typicky volena logistická funkce (sigmoid) 2.7, viz obrázek 2.3. Obor hodnot takovéto funkce je < 0,1 > a jej´ı hodnotu m˚uˇzeme interpretovat jako pravdˇepodobnost pˇr´ısluˇsnosti k tˇr´ıdˇe 1.

f(ξ) = 1

1 +e^−ξ (2.7)

• Multinomiáln´ı klasifikace – je-li c´ılem klasifikace do c tˇr´ıd, je na výstupn´ı vrstvˇe c neuron˚u s aktivaˇcn´ı funkc´ı softmax 2.8. Hodnota ak- tivaˇcn´ı funkce i-tého neuronu je pak povaˇzována za pravdˇepodobnost pˇr´ısluˇsnosti ki-té tˇr´ıdˇe. Výslednou predikc´ıje pak tˇr´ıda jej´ıˇz odpov´ıdaj´ıc´ı neuron má nejvyˇsˇs´ı hodnotu aktivaˇcn´ı funkce.

f(ξ)i = e^ξⁱ

e^ξ¹+· · ·+e^ξ^c (2.8)

• Regrese – na výstupu s´ıtˇe je jeden neuron bez aktivaˇcn´ı funkce (ne- boli s lineárn´ı aktivaˇcn´ı funkc´ıf(ξ) =ξ), a tedy vrac´ı vnitˇrn´ı potenciál neuronu.

(33)

2. Algoritmy

Obr´azek 2.3: Logistick´a funkce

Obrázek 2.4: V´ıcevrstvá neuronová s´ıt’ [3]

2.4 Hlubok´ e uˇ cen´ı

Hluboké uˇcen´ı je pojmenován´ı pro podmnoˇzinu metod strojového uˇcen´ı. Nee- xistuje ovˇsem pˇresný konsenzus o jaké metody jde, nˇekdy se o hlubokém uˇcen´ı mluv´ı jako o neuronových s´ıt´ıch s vˇetˇs´ım poˇctem skrytých vrstev, typicky mi- nimálnˇe tˇri aˇz pˇet, poté jde o tzv. hlubokou neuronovou s´ıt’ (DNN – deep neural network).

Jindy je jako hluboké uˇcen´ıoznaˇcováno ˇsirˇs´ıspektrum metod, které pracuj´ı s velkým poˇctem parametr˚u a velkými objemy dat.

2.5 Konvoluˇ cn´ı neuronov´ e s´ıtˇ e

Konvoluˇcn´ı neuronové s´ıtˇe (CNN, ConvNet – convolutional neural network) jsou jedn´ım ze speciáln´ıch pˇr´ıpad˚u hlubokých neuronových s´ıt´ı. Jsou pouˇz´ıvány 16

(34)

2.6. Architektury konvoluˇcn´ıch s´ıt´ı vhodn´ych pro s´emantickou segmentaci

Obr´azek 2.5: Konvoluˇcn´ı neuronov´a s´ıt’ [4].

pˇredevˇs´ım pˇri analýze a zpracován´ı obrazových dat v rastrovém formátu, pˇr´ıpadnˇe i jiných dat, která je moˇzné do rastrové mˇr´ıˇzky uspoˇrádat.

Základem konvoluˇcn´ıch neuronových s´ıt´ı jsou konvoluˇcn´ı vrstvy [4]. Kromˇe nich pak mezi konvoluˇcn´ımi vrstvami CNN obvykle obsahuje pooling vrstvy a pˇred výstupn´ı vrstvou i nˇekolik plnˇe propojených vrstev. Základn´ı struktura CNN je na obrázku 2.5.

2.5.1 Konvoluˇcn´ı vrstva

Konvoluˇcn´ı vrstva spoˇc´ıvá v konvoluˇcn´ı transformaci vˇsech prvk˚u ze vstupu spoleˇcnˇe s jejich logickým okol´ım pomoc´ı konvoluˇcn´ıch jader. Velikost kon- voluˇcn´ıho jádra a jejich poˇcet jsou hyperparametry CNN, samotné váhy v konvoluˇcn´ım jádru jsou trénovatelným parametrem neuronové s´ıtˇe. Výstupy konvoluˇcn´ı vrstvy jsou oznaˇcovány jako pˇr´ıznakové mapy a maj´ı za c´ıl ve vstupn´ıch datech zvýraznit d˚uleˇzité pˇr´ıznaky.

2.5.2 Pooling vrstva

Pooling vrstva následuje typicky po vrstvˇe konvoluˇcn´ı a slouˇz´ı ke sn´ıˇzen´ı poˇctu pˇr´ıznak˚u tak, ˇze redukuje dimenzi pˇr´ıznakových map. Pouˇz´ıvaj´ı se pˇreváˇznˇe dvˇe varianty: Max Pooling a Average Pooling. Princip vrstvy je takový, ˇze oknem vhodné velikosti jsou postupnˇe pˇrekrývány pˇr´ıznakové mapy a z oblasti tohoto okna je vybrána bud’ maximáln´ı hodnota v pˇr´ıpadˇe Max Poolingu, nebo je do výstupn´ıho rastru vloˇzena pr˚umˇerná hodnota. Pooling vrstvy tak neobsahuj´ı ˇzádné trénovatelné parametry, pouze hyperparametry.

2.6 Architektury konvoluˇ cn´ıch s´ıt´ı vhodn´ ych pro s´ emantickou segmentaci

Pro sémantickou segmentaci je dle [5] jedn´ım z nejvhodnˇejˇs´ıch pˇr´ıstup˚u pouˇzit´ı plnˇe konvoluˇcn´ıch neuronových s´ıt´ı (FCN – fully convolutional networks). Plnˇe konvoluˇcn´ıneuronové s´ıtˇe obsahuj´ıoproti standardn´ım CNN nav´ıc upsampling vrstvy [5], které provád´ı operaci opaˇcnou neˇz pooling vrstvy, tedy zvˇetˇsuj´ı

(35)

2. Algoritmy

Obrázek 2.6: Schéma plnˇe konvoluˇcn´ı neuronové s´ıtˇe [5].

rozliˇsen´ı pˇr´ıznakových map. T´ımto postupem je tak moˇzné z´ıskat výstup poˇzadované velikosti, viz obrázek 2.6.

Dále je pˇredstaveno nˇekolik nejzákladnˇejˇs´ıch topologi´ı konvoluˇcn´ı neuro- nových s´ıt´ı, které se v praxi ukázaly jako vhodné pro úlohu sémantické segmentace.

2.6.1 U-Net

U-net, pˇredstavena autory Olaf Ronneberger, Philipp Fischer a Thomas Brox v roce 2015 [6], je plnˇe konvoluˇcn´ı neuronová s´ıt’, která byla p˚uvodnˇe na- vrhnuta za úˇcelem segmentace biomedic´ınských sn´ımk˚u. V p˚uvodn´ım ˇclánku mˇeli autoˇri k dispozici trénovac´ı mnoˇzinu o velikosti pouze 35 obrázk˚u, pˇresto rozˇs´ıˇren´ım vstupn´ımnoˇziny pomoc´ıaugmentace dat dosáhli vysoké úspˇeˇsnosti.

Pˇr´ıklad architektury U-net s´ıtˇe z [6] je zn´azornˇen na 2.7.

2.6.2 LinkNet

Topologie LinkNet [7] funguje na podobném principu jako U-Net, skládá se taktéˇz z kodéru a dekodéru. C´ılem autor˚u této architektury bylo zkonstruo- vat plnˇe konvoluˇcn´ı neuronovou s´ıt’ pro sémantickou segmentaci, která bude nejen dosahovat dobré pˇresnosti, ale také bude m´ıt niˇzˇs´ı poˇcet parametr˚u a t´ım pádem bude rychlejˇs´ı a efektivnˇejˇs´ı jak jej´ı uˇcen´ı, tak hlavnˇe predikce.

Výsledky pr˚uchodu obrazových dat touto s´ıt´ıje poté moˇzné z´ıskat velmi rychle a to i na mobiln´ıch zaˇr´ızen´ıch a je moˇzné ji pak pouˇz´ıvat pro aplikace, kde je výsledek poˇzadován v reálném ˇcase.

18

(36)

2.7. Vyhodnocen´ı ´uspˇeˇsnosti model˚u

Obr´azek 2.7: Pˇr´ıklad U-net architektury pˇrevzat´y z [6].

2.6.3 PSPnet

PSPNet – pyramid scene parsing network, je dalˇs´ı z konvoluˇcn´ıch neuronových s´ıt´ı urˇcených k sémantické segmentaci. Autoˇri této architektury si vˇs´ımaj´ı, ˇze správná segmentace nevyˇzaduje pouze znalost podoby, respektive pˇr´ıznak˚u jednotlivých objekt˚u, ale také je d˚uleˇzité v jakém kontextu se tyto objekty nacházej´ı. Uvádˇej´ı nˇekolik pˇr´ıklad˚u, k jakým typ˚um chyb m˚uˇze pˇri zanedbán´ı kontextuáln´ı informace vést [8].

Pro vyˇreˇsen´ı tˇechto nedostatk˚u pˇricházej´ı s Pyramid Pooling Module se schematickou podobou na obrázku 2.9. Jako prvn´ı se v architektuˇre nacház´ı kódovac´ıˇcást, která slouˇz´ız´ıskán´ızákladn´ıpˇr´ıznakové mapy o menˇs´ım rozmˇeru.

V [8] autoˇri jako kodér pouˇz´ıvaj´ı ResNet [16] a vstupn´ı obraz zmenˇs´ı na os- minu ˇs´ıˇrky a výˇsky. Takto z´ıskaná pˇr´ıznaková mapa je pak vstupem do Pyra- mid Pooling Module, kde jsou na ni aplikovány konvoluce r˚uzných velikost´ı a zachycuj´ı tak r˚uznˇe ˇsiroký kontext.

2.7 Vyhodnocen´ı ´ uspˇ eˇ snosti model˚ u

Aby bylo moˇzné vyhodnotit jak úspˇeˇsný je model, je potˇreba definovat metriku pomoc´ıkteré lze takovou úspˇeˇsnost mˇeˇrit — ˇc´ım vyˇsˇs´ıje hodnota metriky, t´ım je model úspˇeˇsnˇejˇs´ı. Mezi bˇeˇznˇe pouˇz´ıvané metriky patˇr´ı napˇr. euklidovská vzdálenost, manhattanská vzdálenost, kos´ınová podobnost ˇci korelaˇcn´ı koefi-

(37)

2. Algoritmy

Obr´azek 2.8: Architektura LinkNet [7].

Obr´azek 2.9: Architektura PSPnet [8].

20

(38)

2.7. Vyhodnocen´ı ´uspˇeˇsnosti model˚u Tabulka 2.1: Matice z´amˇen

Pˇredpovˇed’

Skute ˇcnost

ANO NE

ANO TP FN

NE FP TN

cient. Volba té správné metriky závis´ı na tom jaký maj´ı modelovaná data charakter a je velmi d˚uleˇzitá pro správné vyhodnocen´ı.

2.7.1 Matice z´amˇen

Uvaˇzujme binárn´ı klasifikátor, který urˇcuje, zda vstup patˇr´ı do nˇejaké tˇr´ıdy nebo ne, výstup je tady ANO/NE. Nastávaj´ı pak ˇctyˇri pˇr´ıpady, jak klasifikace mohla dopadnout. Tyto moˇznosti jsou znázornˇeny v matici zámˇen 2.7.1.

V pˇr´ıpadˇe, ˇze klasifikace probˇehla správnˇe, je výsledek bud’ TP (True positive) – klasifikátor predikoval ANO a skuteˇcnost byla stejná, nebo je výsledek TN (True negative) – predikce byla NE a skuteˇcnost taktéˇz. Pokud byla predikce klasifikátoru nesprávná, pak nastává moˇznost FN (False negative) – klasifikátor predikoval NE, ale skuteˇcnost byla ANO, nebo pˇr´ıpad FP (False positive), kdy je nesprávnˇe predikováno ANO.

Kombinac´ı tˇechto ˇctyˇr moˇznost´ı je moˇzné stanovit metriky kvalit klasi- fikátoru, tak aby hodnotily ty kvality, které jsou od klasifikátoru pro danou

úlohu poˇzadovány. Jako pˇr´ıklad je moˇzné uvést situaci z lékaˇrstv´ı, kdy m˚uˇze být poˇzadováno, aby nˇejaký test s binárn´ım výstupem, který odhaluje závaˇzné onemocnˇen´ı dˇelal co nejménˇe chyb typu false negative (faleˇsnˇe negativn´ı) a naopak nemus´ı vadit, kdyˇz udˇelá nˇekolik chyb false positive (faleˇsnˇe pozitivn´ı).

Nˇekolik bˇeˇznˇe pouˇz´ıvaných metrik pro binárn´ı klasifikaci, které je ale moˇzno rozˇs´ıˇrit i pro klasifikaci do v´ıce tˇr´ıd, je pˇredstaveno dále.

• Pˇresnost (accuracy)

accuracy= T P +T N

T P +T N+F P +F N (2.9)

• Senzitivita (sensitivity, recall)

sentsitivity= T P

T P +F N (2.10)

• Specificita (specificity)

specif icity = T N

T N+F P (2.11)

(39)

2. Algoritmy

2.7.2 Intersection over Union

Intersection over Union (IoU) je název pro metriku hojnˇe vyuˇz´ıvanou pro hodnocen´ı úspˇeˇsnosti sémantické segmentace nebo obecnˇe jakékoliv detekce nejen v obrazových datech. Nˇekde je uvádˇen také pod jménem Jaccard˚uv index ˇci koeficient.

IoU(vzor, predikce) = |vzor∩predikce|

|vzor∪predikce| (2.12)

IoU = T P

T P +F P +F N (2.13)

Hlavn´ı výhodou této metriky je, ˇze pˇri posuzován´ı úspˇeˇsnosti vynechává skuteˇcnˇe negativn´ı datové vzory, které v pˇr´ıpadˇe segmentace obrazu nebo detekce stejnˇe z principu nehledáme.

2.8 Uˇ ´ celov´ a funkce

Souˇcást´ımatematické optimalizace, a tedy i trénován´ımodelu, mus´ıbýt funkce, pomoc´ıkteré odhadujeme aktuáln´ıchybu modelu. Takové funkci se ˇr´ıká úˇcelová funkce (loss function). Ve strojovém uˇcen´ı je pˇri procesu uˇcen´ı minimalizována hodnota úˇcelové funkce mˇeˇrené na trénovac´ı (a pˇr´ıpadnˇe validaˇcn´ı) mnoˇzinˇe.

Pro posouzen´ı kvality natrénovaného modelu se pak poˇc´ıtá hodnota úˇcelové funkce na nezávislé testovac´ı mnoˇzinˇe. Stejnˇe jako u metriky i volba úˇcelové funkce je závislá na charakteru vstupn´ıch a výstupn´ıch dat a jej´ı volba je zásadn´ı pro vytvoˇren´ı funkˇcn´ıho modelu.

2.9 Morfologick´ e operace

Matematická morfologie je pomˇernˇe sloˇzitá teorie s velkým praktickým vyuˇzit´ım nejen v oblasti poˇc´ıtaˇcového vidˇen´ı. V kontextu této práce je potˇreba pouze nˇekolik základn´ıch morfologických operac´ıa pro úˇcely pouˇzit´ıpro ˇreˇsený problém nepotˇrebujeme jejich formáln´ı definice, ale vystaˇc´ıme si pouze s pˇredstaven´ım praktického fungován´ı.

2.9.1 Dilatace

Jednou ze základn´ıch operac´ı matematické morfologie je dilatace. Spoˇc´ıvá v konvoluci s oknem zvolené velikosti, kde je na výstup pˇriˇrazena maximáln´ı hodnota z uvaˇzovaného okna. Výsledek takovéto operace demonstruje obrázek 2.10. B´ılé regiony se rozrostly, operace je tedy vhodná napˇr´ıklad na vyplnˇen´ı nechtˇených mezer segmentovaných oblast´ı.

22

(40)

2.9. Morfologick´e operace

Obr´azek 2.10: Vlevo p˚uvodn´ı stav, vpravo stav po aplikaci dilatace. [9]

Obr´azek 2.11: Vlevo p˚uvodn´ı stav, vpravo stav po aplikaci eroze. [9]

2.9.2 Eroze

Operace eroze je opakem dilatace, lze ji pouˇz´ıt v pˇr´ıpadˇe, kdyˇz se v obrázku chceme zbavit detail˚u a nebo ˇsumu. Pˇr´ıklad aplikován´ıtéto operace je zobrazen na obrázku 2.11

2.9.3 Skeletonizace

C´ılem skeletonizace je nalézt topologickou kostru objektu, coˇz spoˇc´ıvá v transformaci p˚uvodn´ıho objektu na kˇrivky jednotkové ˇs´ıˇrky, tak aby p˚uvodn´ı objekt co nejlépe reprezentovaly. Ukázku takovéto transformace lze vidˇet na obrázku 2.12. Skeletonizace m˚uˇze být uˇziteˇcná pro pˇredzpracován´ı dat pˇri pˇrevodu z rastrového do vektorového formátu.

(41)

2. Algoritmy

Obr´azek 2.12: Vlevo p˚uvodn´ı stav, vpravo stav po skeletonizaci. [?]

24

(42)

Kapitola 3

Anal´ yza probl´ emu a n´ avrh ˇ reˇ sen´ı

Problém ˇreˇsený v této práci spoˇc´ıvá v identifikaci geografické polohy vyvýˇsených liniových staveb, jako jsou ochranné hráze, silnice, ˇzeleznice a dalˇs´ı, a to pˇreváˇznˇe v ˇr´ıˇcn´ıch nivách. Znalost polohy takovýchto struktur m˚uˇze pomoci pˇri modelován´ı povodˇnových rizik. Pro praktické pouˇzit´ı je potˇreba identifi- kované liniové stavby pˇrevést do vhodného vektorového GIS formátu.

3.1 Vstupn´ı data

Primárn´ım podkladem pro identifikaci jsou digitáln´ı výˇskové modely (DEM).

Jako dalˇs´ı data ke zpˇresnˇen´ı identifikace, tam kde informace z DEM nejsou dostateˇcné, je moˇzné vyuˇz´ıt satelitn´ı obrazové sn´ımky. Pro úˇcely strojového uˇcen´ı je k dispozici také vektorový popis omezeného poˇctu liniových staveb tak, jak jsou poˇzadovány jako potencionáln´ı výstup.

Data dodaná zadavatelem pocház´ı z nˇekolik geografických oblast´ı, jde o okol´ı polské ˇreky Wisla, ˇceské ˇreky Moravy a tˇr´ı oblast´ı v Rakousku – okol´ı ˇreky Inn v oblasti mˇesta Innsbruck, okol´ı ˇreky Salzach v oblasti Salzburgu a okol´ı ˇreky Dunaj v oblasti mˇesta Linz.

3.1.1 Digitáln´ı výˇskové modely

Digitáln´ı výˇskové modely byly poskytnuty zadavatelem práce, jelikoˇz ne pro vˇsechny oblasti jsou tato data volnˇe dostupná v dostateˇcné kvalitˇe. Hori- zontáln´ı rozliˇsen´ı poskytnutých výˇskových model˚u je 10 m a jsou v r˚uzných systémech souˇradnic podle toho, které územ´ı výˇskovˇe popisuj´ı. Formát do- daných soubor˚u je GeoTIFF, coˇz je pro tento typ dat standardn´ı.

Vizualizace digitáln´ıho výˇskového modelu je moˇzná uˇzit´ım libovolných ba- revných ˇskál, na obrázku 3.1 je pˇr´ıklad takovéto vizualizace pomoc´ı stupˇn˚u ˇsedi.

(43)

3. Analýza problému a návrh ˇreˇsen´ı

Obrázek 3.1: Vizualizace dat z digitáln´ıho výˇskového modelu

3.1.2 Satelitn´ı sn´ımky

Satelitn´ı sn´ımky z mise Sentinel-2 poskytované evropskou kosmickou agentu- rou jsou dostupné z Copernicus Open Access Hub. Pouˇzity byly sn´ımky typu Level-2A v nejvyˇsˇs´ım dostupném rozliˇsen´ı, které ˇcin´ı 10 m. V tomto rozliˇsen´ı je dostupných nˇekolik spektráln´ıch pásem. Po ruˇcn´ım prozkoumán´ı sn´ımk˚u a dat se ukázalo, ˇze potencionálnˇe pˇr´ınosná jsou pouze pásma viditelného spektra (ˇcervené, zelené, modré), která tvoˇr´ı TCI (true color image).

Sn´ımky jsou organizovány v dlaˇzdic´ıch, které pokrývaj´ı územ´ı r˚uzných rozloh a je u nich pouˇzit souˇradnicový systém UTM WSG84. K uloˇzen´ı tˇechto sn´ımk˚u je pouˇzit formát JPEG 2000, viz sekce 1.4.1.2. Ukázkou ˇcásti takového sn´ımku je obrázek 3.2.

3.1.3 Ochranné hráze a náspy liniových staveb

Geografická poloha ochranných hráz´ı a násp˚u liniových staveb je reprezen- tována jako vektory v GIS formátu Esri Shapefile v r˚uzných systémech souˇradnic.

Tyto vektory byly taktéˇz dodány zadavatelem a pˇredstavuj´ı výstup, který chceme aby nástroj navrhovaný v této práci generoval.

Pˇr´ıklad ˇcásti takových vektor˚u, které polohovˇe odpov´ıdaj´ı ukázce satelitn´ıho sn´ımku na obrázku 3.2 i ukázce digitáln´ıho výˇskového modelu na obrázku 3.1, lze vidˇet na obrázku 3.3.

3.2 Moˇ zn´ a ˇ reˇ sen´ı

V této ˇcásti bude rozebráno nˇekolik moˇzných variant, jak je k ˇreˇsenému problému moˇzno pˇristupovat, a jak jsou ˇcásteˇcnˇe shodné ˇci alespoˇn analo- 26

(44)

3.2. Moˇzn´a ˇreˇsen´ı

Obr´azek 3.2: RGB satelitn´ı sn´ımek

Obrázek 3.3: Pˇr´ıklad vektor˚u hráz´ı a násp˚u liniových staveb

(45)

3. Analýza problému a návrh ˇreˇsen´ı

gické problémy ˇreˇseny jinými autory. Následnˇe bude pˇredstavena metoda zvolena pro tuto práci, která byla vyhodnocena jako nejvhodnˇejˇs´ı vzhledem ke vstupn´ım dat˚um a vzhledem k poˇzadovanému zamˇeˇren´ı této práce na metody strojového uˇcen´ı.

3.2.1 Morfometrick´e charakteristiky

Identifikace ochranných hráz´ı a násp˚u liniových staveb v digitáln´ıch výˇskových modelech je problém, kterým se zabývá nˇekolik prac´ı [17], [18], [19], jejichˇz spoleˇcným prvkem je pouˇzit´ı r˚uzných morfometrických charakteristik. Morfo- metrie se zabývá ˇc´ıselným vyvozován´ım charakteristiky tvar˚u zemského povrchu [20].

V [17] je pro identifikaci vyuˇz´ıváno 5 morfometrických charakteristik – re- lativn´ı výˇska, sklon, smˇer sklonu (aspect), profilová kˇrivost (profile curvature) a planárn´ı kˇrivost (planar curvature). Jejich detailn´ı popis je uveden v [17].

Takto z´ıskané pˇr´ıznaky mohou poté slouˇzit k identifikaci bud’ pˇr´ımo, vyuˇzit´ım prahových hodnot pro jednotlivé pˇr´ıznaky, a nebo jako vstup do klasifikátoru.

Ve vˇsech prac´ıch maj´ı autoˇri k dispozici digitáln´ı výˇskové modely lepˇs´ıho horizontáln´ıho rozliˇsen´ı, neˇz je 10 m jako v této práci.

3.2.2 S´emantick´a segmentace

Na identifikaci polohy ochranných hráz´ı je moˇzno nahl´ıˇzet jako na binárn´ı klasifikaci. Pro kaˇzdý pixel jak digitáln´ıho výˇskového modelu, tak pˇr´ıpadnˇe i satelitn´ıho sn´ımku, provedeme klasifikaci, zda jde o hráz ˇci nikoliv. Výstup takovéhoto klasifikátoru je ekvivalentn´ı s výstupem procesu sémantické segmentace obrazu.

Jak jiˇz bylo zm´ınˇeno, konvoluˇcn´ı neuronové s´ıtˇe jsou vhodným nástrojem pro sémantickou segmentaci. Moˇznost pouˇzit´ı tohoto pˇr´ıstupu pro identifikaci ochranných hráz´ı je ovˇeˇrena v [21]. Autoˇri této práce pouˇzili jako vstupn´ı data digitáln´ı výˇskový model s horizontáln´ım rozliˇsen´ım 5 m, vektory silnic a ˇzeleznic a vektory ˇr´ıˇcn´ıch s´ıt´ı. Jako model byla pouˇzita konvoluˇcn´ı neuronová s´ıt’ typu U-net, úspˇeˇsnost mˇeˇrená metrikou IoU 2.7.2 je vyˇc´ıslena na 0.73 na trénovac´ıch datech a 0.48 na datech validaˇcn´ıch. Data pouˇzitá k trénován´ı a k validaci pocházej´ı dle autor˚u ze stejného geografického regionu a to ze státu Florida, USA. Pro vytvoˇren´ı fináln´ı predikce poloh ochranných hráz´ı je na výstup U-net aplikováno jeˇstˇe nˇekolik úprav, které jsou detailnˇe popsány v [21].

3.3 Zvolen´ e ˇ reˇ sen´ı

Vzhledem k povaze vstupn´ıch dat, tedy digitáln´ıho výˇskového modelu, který má menˇs´ırozliˇsen´ı, neˇz maj´ık dispozici autoˇri prac´ı, vyuˇz´ıvaj´ıc´ımorfometrické charakteristiky a také s ohledem na dalˇs´ı vstup, u kterého je potˇreba ovˇeˇrit, 28

(46)

3.3. Zvolené ˇreˇsen´ı zda m˚uˇze nedostateˇcnou kvalitu DEM vykompenzovat – obrazové satelitn´ı sn´ımky, a v neposledn´ı ˇradˇe s ohledem na apriorn´ı c´ıl, ovˇeˇrit vhodnost pouˇzit´ı modern´ıch metod strojového uˇcen´ı, je v této práci k implementaci a otestován´ı zvolena metoda sémantické segmentace.

K sémantické segmentaci je vyuˇzito konvoluˇcn´ıch neuronových s´ıt´ı. Je otes- tována úspˇeˇsnost nˇekolika nejpouˇz´ıvanˇejˇs´ıch s´ıt´ı a to U-net, LinkNet a PSP- Net s, na jiných úlohách úspˇeˇsnˇe pouˇzitými, architektury kódovac´ıˇcásti tˇechto s´ıti. Dále je vybrána jedna z testovaných konvoluˇcn´ıch neuronových s´ıt´ı a je empiricky optimalizována jej´ı architektura.

D˚uleˇzitou souˇcást´ızvolené metody je následné zpracován´ı(post-processing) hrubého výstupu modelu. Jednotlivé kroky jsou popsány a rozebrány na konkrétn´ıch pˇr´ıkladech v kapitole zabývaj´ıc´ı se implementac´ı. Proces závˇereˇcné vektorizace identifikovaných hráz´ı je taktéˇz prezentován v následuj´ıc´ı kapitole.

(47)

(48)

Kapitola 4

Implementace

K implementaci bylo vyuˇzito jazyka Python ve verzi 3 a interaktivn´ıho webového vývojového prostˇred´ıJupyter notebook. Python je v dobˇe psan´ıtéto práce bez- konkurenˇcnˇe nejpouˇz´ıvanˇejˇs´ım jazykem pouˇz´ıvaným pro implementaci proto- typ˚u model˚u a algoritm˚u strojového uˇcen´ı. Mezi jeho pˇrednosti patˇr´ı jedno- duchost a rychlost s jakou je moˇzné programy implementovat a pˇredevˇs´ım velké mnoˇzstv´ı r˚uzných knihoven. Nevýhodou je pak v urˇcitých pˇr´ıpadech niˇzˇs´ı výkonnost pˇri výpoˇcetnˇe nároˇcných úlohách nebo pˇri práci s velkým mnoˇzstv´ım dat.

4.1 Pouˇ zit´ e knihovny

Implementovat algoritmy strojového uˇcen´ı od základu v samotném jazyku Python by bylo ˇcasovˇe velmi nároˇcné a neefektivn´ı, proto je pouˇzito nˇekolik uˇziteˇcných knihoven. Výˇcet a struˇcný popis nˇekolika, z hlediska implemento- vané úlohy nejd˚uleˇzitˇejˇs´ıch, je uveden n´ıˇze.

• Numpy– Pˇridává podporu n-rozmˇerných pol´ı a matic velkého rozsahu.

Umoˇzˇnuje na tˇechto datových strukturách efektivnˇe provádˇet matema- tické operace.

• Cv2 – Python interface pro OpenCV. OpenCV (Open Source Compu- ter Vision Library) je opensource knihovna, která slouˇz´ı k manipulaci s obrazovými daty a poskytuje algoritmy a metody z oblasti poˇc´ıtaˇcového vidˇen´ı a obecnˇe strojového uˇcen´ı.

• Gdal – Gdal je knihovna urˇcená na manipulaci s rastrovými i vekto- rovými GIS daty. Gdal je knihovna v jazyce C++ je ale poskytováno API pro Python.

• Tensorflow- Opensource framework strojov´eho uˇcen´ı, poskytnut´y spoleˇcnost´ı Google.

(49)

4. Implementace

Obrázek 4.1: Vlevo vektory ochranných hráz´ı, vpravo po rasterizaci. Jako pozad´ı je pouˇzit digitáln´ı výˇskový model.

• Keras– API pro hlubok´e uˇcen´ı, pouˇz´ıv´a Tensorflow.

• Segmentation models – knihovna, poskytuj´ıc´ı API k konvoluˇcn´ım neuronovým s´ıt´ım pro sémantickou segmentaci, vyuˇz´ıvá Keras a Ten- sorflow [22].

4.2 Pˇ redzpracov´ an´ı vstupn´ıch dat

Pˇredt´ım, neˇz je moˇzné pˇristoupit k trénován´ı konvoluˇcn´ıch neuronových s´ıt´ı, je potˇreba data transformovat do podoby, která je vhodná pro vstup do tohoto typu modelu.

4.2.1 Rasterizace vektor˚u ochrann´ych hr´az´ı

Ochranné hráze jsou k dispozici ve vektorovém formátu, který nen´ı pro CNN vhodný, proto je potˇreba tato data pˇrevést na rastr. K rasterizace je vyuˇzito metodyRasterizeLayerz knihovny Gdal. Rasterizace je provedena do stejného rozliˇsen´ı a stejného souˇradnicovém systému, který maj´ı odpov´ıdaj´ıc´ı digitáln´ı výˇskové modely, kaˇzdá ochranná hráz má tedy pro rasterizaci ˇs´ıˇrku 1 px.

Ukázku podoby ochranných hráz´ı ve vektorovém formátu a po rasterizaci lze vidˇet na obrázku 4.1.

4.2.2 Slouˇcen´ı satelitn´ıch sn´ımk˚u

Jelikoˇz jsou satelitn´ı sn´ımky poskytovány v dlaˇzdic´ıch r˚uzných rozmˇer˚u, a k pˇrekryt´ı územ´ı, které odpov´ıdá poskytnutým výˇskovým model˚um je potˇreba dlaˇzdic nˇekolik, je nezbytné tyto dlaˇzdice slouˇcit tak, aby byl zachován souˇradnicový systém. K tomu je pouˇzita utilita gdal merge.py, která je souˇcást´ı knihovny Gdal.

Pˇri stahován´ı satelitn´ıch sn´ımk˚u z Copernicus Open Access Hub je pod- statné, aby byly vˇsechny pouˇzité sn´ımky poˇr´ızeny ideálnˇe v co nejkratˇs´ım 32