• Nebyly nalezeny žádné výsledky

HODNOCENÍ PŘESNOSTI KLASIFIKACÍ verze 1.0 autor listu: Lucie Červená

N/A
N/A
Protected

Academic year: 2022

Podíl "HODNOCENÍ PŘESNOSTI KLASIFIKACÍ verze 1.0 autor listu: Lucie Červená"

Copied!
13
0
0

Načítání.... (zobrazit plný text nyní)

Fulltext

(1)

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 1 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce 2018.

HODNOCENÍ PŘESNOSTI KLASIFIKACÍ

verze 1.0

autor listu: Lucie Červená

Cíle

V tomto výukovém listu se dozvíte, jak zhodnotit přesnost výstupu klasifikace snímku, konkrétně:

– jak a kolik zvolit kontrolních bodů.

– co je to chybová matice, jak se spočítá uživatelská, zpracovatelská a celková přesnost. Co je kappa koeficient.

– jak provést hodnocení přesnosti klasifikace s využitím ENVI (verze 5.4) a ArcGIS (10.5).

– jak interpretovat získané výsledky hodnocení přesnosti.

Prerekvizity

Student umí provést klasifikaci snímku (řízenou i neřízenou, viz samostatné výukové listy z roku 2016). Též by měl být obeznámen s daty Landsat (pokud není, lze dostudovat například online zde https://landsat.usgs.gov/, kde je možné nalézt i odkaz k jejich stažení) a samozřejmě umět základní operace se softwarem ENVI (načtení dat a jejich zobrazení, zoom apod.). V této úloze je též potřeba znalost nějakého geoinformačního systému (ideálně ArcGIS, ale je možné využít i QGIS či jiné).

Teoretické základy hodnocení přesnosti klasifikací

Klasifikace snímku může být považována za dokončenou teprve tehdy, když jsou provedeny všechny postklasifikační úpravy včetně zhodnocení přesnosti klasifikace, kde je porovnáván klasifikovaný ob- raz s realitou (snímkem, ortofotem, GPS daty, ZABAGED,...). Porovnání celého klasifikovaného obrazu se skutečným územím by však bylo velmi finančně a časově náročné, takže se používají statistické odhady přesnosti klasifikace, např. pomocí náhodně vygenerovaného vzorku pixelů.

Kontrolní body

Existuje několik způsobů, jak vygenerovat náhodné body pro zhodnocení výsledku klasifikace (tzv.

kontrolní body), viz obrázek 1.

Nejjednodušším, ale ne příliš praktickým, je jednoduchý náhodný design („Simple random“), kte- rý vygeneruje zadaný počet kontrolních bodů náhodně v celé ploše klasifikovaného snímku. Nevýho- dou je ovšem to, že pro málo rozlehlé třídy klasifikační legendy se nemusí vygenerovat žádný kon- trolní bod nebo pouze malý počet, který není statisticky dostatečný, a přesnost klasifikace takovéto třídy pak nejde zhodnotit. Též některé části území mohou být pokryté body hustě a jiné pouze zřídka.

Kontrolními body rovnoměrně pokryto je celé území v případě jednoduchého systematického designu („Simple systematic“), který generuje kontrolní body v pravidelné mřížce – např. každých 10 metrů 1 bod. Co se týče málo rozlehlých tříd, mohou nastávat stejné problémy jako u jednoduchého náhodného generování kontrolních bodů.

(2)

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 2 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce 2018.

Tento problém pak řeší vrstevnatý náhodný design („Stratified random“), který generuje pomě- rově pro každou třídu legendy tolik bodů podle toho, jak je třída zastoupena v daném území – např.

1 % pixelů zařazených do každé kategorie. K vygenerování takovéhoto vzorku kontrolních bodů je však dobré mít data, která reprezentují realitu, pro celé území. V praxi je toto však často nemožné, proto se body generují nad výslednou klasifikací (kterou chceme hodnotit) a následně se těmto bo- dům přiřazuje na základě terénního průzkumu či jiných dat jejich reálná třída.

Pokud má být zhodnocena klasifikace rozlehlých nebo špatně dostupných území, je užitečný dvoufázový shlukový design („2-Stage Clustered“), ve kterém jsou vybrána menší území, pro která jsou dostupná další podkladová data či je možné navštívit je v terénu a která pokrývají všechny třídy legendy. V rámci těchto menších ploch jsou pak body náhodně generovány s pomocí některé z výše zmíněných možností.

Obr. 1. Různé způsoby generování náhodných kontrolních bodů [3].

Počet kontrolních bodů by měl být minimálně 50 pro každou třídu krajinného pokryvu, avšak pro rozlehlejší území (více než 100 km2) a pro území, ve kterém se vyskytuje více než 12 tříd krajinného pokryvu, by měl být počet těchto bodů pro každou třídu navýšen na 75 až 100. Počty bodů pro kaž- dou třídu lze však přizpůsobovat i podle důležitosti a četnosti výskytu těchto tříd v klasifikovaném území. (Lillesand et al., 2008)

Chybová matice

Klasifikační chybová matice, někdy také označovaná jako kontingenční tabulka (v angličtině error matrix, confusion matrix nebo contingency table), je vždy čtvercová a obsahuje tolik řádků a tolik sloupců, kolik tříd obsahuje legenda posuzované klasifikace (obrázek 2). Řádky chybové matice jsou

(3)

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 3 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce 2018.

vždy tvořeny klasifikovanými daty a její sloupce daty, která odpovídají skutečnosti. Data správně kla- sifikovaná, odpovídající skutečnému zemskému pokryvu, se nachází v této chybové matici na hlavní diagonále jdoucí z levého horního rohu do rohu pravého dolního (v ideálním případě by měla být tvořena nejvyššími hodnotami v tabulce a hodnoty mimo tuto diagonálu by měly být nulové). Všech- ny ostatní hodnoty mimo hlavní diagonálu jsou chyby, a to buď chyby z opomenutí (omission) či chy- by z nesprávného zařazení (commision). Chyby z opomenutí korespondují s hodnotami ve sloupcích mimo hlavní diagonálu – je to počet pixelů, které jsou ve skutečnosti určitou třídou, avšak v klasifikaci byly zařazeny do tříd jiných. Chyby z nesprávného zařazení korespondují s hodnotami v řádcích mimo hlavní diagonálu – je to počet pixelů, které byly zařazeny do určité třídy, ale ve skutečnosti reprezen- tují třídy jiné. (Lillesand et al., 2008)

Třída 1 2 3 Celkem

1 (vodní plochy) 97 0 3 100

2 (lesy) 3 279 18 300

3 (orná půda) 2 1 97 100

Celkem 102 280 118 500

Obr. 2. Chybová matice: klasifikovaná data se nachází v řádcích (oranžově), referenční data ve sloupcích (zeleně), tmavšími odstíny jsou zvýrazněny chyby ze špatného zařazení (oranžově) a z opomenutí (zeleně).

Existují dva typy chybových matic. Prvním typem je chybová matice založená na trénovacích da- tech (sloupce matice jsou tvořeny trénovacími daty). Tato chybová matice a ukazatele přesnosti od- vozené od ní však hodnotí pouze výsledek klasifikace trénovacích ploch, nikoliv celého obrazu. Vypo- vídá pouze o tom, jak dobře lze využít statistické charakteristiky získané z trénovacích ploch na klasifikaci těch samých ploch. Druhý typ chybové matice je založen na náhodném vzorkování, kde je nejprve potřeba definovat vhodný počet bodů dobře geograficky rozmístěných v obraze, u kterých je známo, jakou třídu krajinného pokryvu skutečně reprezentují (viz výše – část Kontrolní body).

V případě chybové matice druhého typu jsou sloupce matice tvořeny právě těmito referenčními bo- dy. Všechna hodnocení přesnosti vycházející z této chybové matice mají vypovídající hodnotu o přes- nosti klasifikace celého obrazu. (Lillesand et al., 2008)

Uživatelská, zpracovatelská a celková přesnost

Z klasifikačních chybových matic pak vycházejí další ukazatele přesnosti – jedná se o uživatelskou přesnost, zpracovatelskou přesnost a přesnost celkovou (obrázek 3).

Uživatelská přesnost (User’s Acuracy) udává, s jakou pravděpodobností pixel zařazený do určité třídy tuto třídu doopravdy představuje. Počítá se pro každou třídu zvlášť, a to jako podíl správně klasi- fikovaných pixelů (hodnota na hlavní diagonále) ku počtu pixelů, které do této kategorie byly zařaze- ny (suma v řádku odpovídajícímu posuzované třídě). (Lillesand et al., 2008)

Zpracovatelská přesnost (Producer’s Accuracy) je poměr mezi správně klasifikovanými pixely (opět hodnota na hlavní diagonále) a pixely použitými pro testování dané třídy (suma ve sloupci, tj.

celkový počet pixelů trénovacích ploch dané třídy či počet bodů použitých pro testování dané třídy).

(Lillesand et al., 2008)

Přesnost celková (Overall Accuracy) se udává pro celou klasifikaci. Počítá se jako podíl všech správně vyklasifikovaných pixelů (suma hodnot na hlavní diagonále) ku celkovému počtu klasifikova- ných pixelů. (Lillesand et al., 2008)

(4)

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 4 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce 2018.

Třída 1 2 3 Celkem Uživatelská přesnost

1 (vodní plochy) 97 0 3 100 0,97 (97/100)

2 (lesy) 3 279 18 300 0,93 (279/300)

3 (orná půda) 2 1 97 100 0,97 (97/100)

Celkem 102 280 118 500 x

Zpracovatelská přesnost 0,951 (97/102)

0,996 (279/280)

0,822

(97/118) x

Celková přesnost 0,946 ((97+279+97)/500) Obr. 3. Výpočet uživatelské, zpracovatelské a celkové přesnosti z chybové matice.

Kappa koeficient

Jiným ukazatelem přesnosti je Kappa koeficient. Tento koeficient porovnává přesnost provedené klasifikace (určené z chybové matice) s přesností dosažitelnou čistě náhodným zařazením pixelů do jednotlivých tříd (vzorec 1). Hodnota koeficientu Kappa se může pohybovat v rozmezí hodnot nula až jedna. Vyšší hodnoty znamenají lepší výsledek (shodu), nad 0,75 se jedná o dobrý výsledek klasifika- ce. Hodnota jedna by znamenala, že při dané klasifikaci bychom se vyhnuli 100 % chyb, které by vznikly při čistě náhodném zařazování pixelů do jednotlivých tříd. (Dobrovolný, 1998)

2

ii i i

i i

N x x x

N x x

 

 

 

  

Vzorec 1: Výpočet kappa koeficientu (N - počet prvků, xi+ (x+i ) - prvky v i-tém řádku (sloupci)), pro data z obrázku 2 by tedy platilo: 𝜿 =𝟓𝟎𝟎∗(𝟗𝟕+𝟐𝟕𝟗+𝟗𝟕)−(𝟏𝟎𝟎∗𝟏𝟎𝟐+𝟑𝟎𝟎∗𝟐𝟖𝟎+𝟏𝟎𝟎∗𝟏𝟏𝟖)

𝟓𝟎𝟎𝟐−(𝟏𝟎𝟎∗𝟏𝟎𝟐+𝟑𝟎𝟎∗𝟐𝟖𝟎+𝟏𝟎𝟎∗𝟏𝟏𝟖) = 𝟎, 𝟗𝟎𝟔.

Hodnocení přesnosti klasifikace s využitím softwarů ENVI a ArcMap

Tvorba kontrolního (validačního) datasetu

Základním předpokladem pro hodnocení přesnosti klasifikace je mít referenční data, se kterými lze výslednou klasifikaci srovnávat. Taková data lze získat terénním průzkumem zájmové oblasti a zamě- řením vybraných ploch pro všechny třídy legendy (krajinného pokryvu) například pomocí globálních navigačních satelitních systémů (GNSS). Pokud data z terénu nemáme, další možností je vytvořit kon- trolní dataset vygenerováním náhodných bodů a přiřazením jim tříd legendy na základě dalších dato- vých zdrojů – např. ortofotomap či jiných obrazových dat o lepším prostorovém rozlišení než je klasi- fikovaný snímek (viz teoretická část výukového listu).

V ENVI existují dva nástroje (Classification > Post Classification) pro tvorbu náhodných bodů:

1. Generate Random Sample Using Ground Truth ROIs – využije se například tehdy, když máme k dispozici polygony z terénního průzkumu a chceme vybrat náhodné body nad těmito daty. Po- stup je následující – importujeme shapefile do ENVI pomocí ROI tool (File > Import vector – Unique records of an attribute to separate ROIs, více viz výukový list Řízená klasifikace) a uložíme ho jako „klasický ROI“ s příponou *.roi (File > Export > Export to Classic, obrázek 4). Následně

(5)

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 5 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce 2018.

pomocí nástroje Generate Random Sample Using Ground Truth ROIs vygenerujeme dle zvoleného designu, ideálně Stratified Random (viz teoretická část výukového listu), náhodné kontrolní body (viz obrázek 5) pomocí nichž lze následně zhodnotit přesnost vytvořené klasifikace nástrojem Confusion Matrix Using Ground Truth ROIs (viz dále).

Obr. 4. Export ROIs ve formálu *.xml do „klasického“ formátu ENVI *.roi.

Obr. 5. Vytvoření náhodných bodů na základě polygonů zaměřených v terénu.

2. Generate Random Sample Using Ground Truth Image – máme-li k dispozici referenční obraz z terénu, lze ho přímo využít k vygenerování kontrolních bodů pro zhodnocení klasifikace pomocí funkce Confusion Matrix Using Ground Truth ROIs (viz dále). Takovýto podklad ale většinou nee- xistuje, neboť při znalosti rozložení všech tříd na celé ploše zájmového území by již klasifikace

(6)

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 6 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce 2018.

družicových snímků nebyla nutná. Běžně se tedy využívá pro vygenerování náhodných bodů sa- motný výstup klasifikace k hodnocení, který by měl zaručit alespoň zhruba správné poměry bodů pro jednotlivé třídy při designu „Stratified random“. Postup je následující – v prvním kroku se vy- bere výstup klasifikace, v druhém kroku třídy legendy k hodnocení (typicky všechny), nakonec pak pravidla, jak generovat náhodné body (viz obrázek 5) – na výběr jsou tři designy – Random (zcela náhodný), Stratified random (počet bodů přímo úměrný rozloze tříd) a Equalized Random (stejný počet bodů pro každou z tříd). Nejlepší (viz teorie) je vybrat design Stratified Random, který dává na výběr ze dvou možností – proporční (proportionale) a disproporční (disproportiona- le). Proporční vygeneruje zadané procento bodů z počtu pixelů náležících do dané třídy. U dis- proporčního je na uživateli, aby pro každou třídu zadal, kolik náhodných bodů se má vygenerovat (set class sample sizes, obrázek 6). To pak záleží na uživatelově trpělivosti a důležitosti úlohy – čím více bodů bude vygenerováno, tím spolehlivější výsledky o přesnosti klasifikace budou získá- ny (ideální počet viz teoretická část), ale je třeba mít na paměti, že následně bude nutné každý bod zobrazit nad ortofotomapou či jiným datovým zdrojem a rozhodnout, do které třídy patří, což je velmi časově náročné. Výstup lze uložit například jako Single ROI a následně v ROI Tool ten- to soubor exportovat do shapefilu – ideálně polygonového (File > Export > Export to Shapefile, obrázek 4 a 7). Vektory pak lze otevřít v ArcMap či jiném geoinformačním softwaru, kde je možné načíst WMS služby (například s ortofotomapami) a pomocí editačního nástroje polygonu po poly- gonu (reprezentujícího vždy právě jeden pixel) přiřazovat příslušnou třídu legendy (obrázek 8), případně polygon smazat, pokud se jeho třída nedá určit jednoznačně (např. obrázek 9 – v pixelu se vyskytují listnaté stromy, zástavba i trvalý travní porost). S vizuální interpretací mohou též pomoci i barevné syntézy klasifikovaných snímků. Poté, co je každému bodu přiřazen atribut třídy a změny uloženy, lze se opět vrátit do ENVI, kde stačí načíst shapefile s kontrolními body a pro- vést hodnocení klasifikace nástrojem Confusion Matrix Using Ground Truth ROIs (viz dále).

Obr. 6. Disproporční zadávání počtu náhodných bodů pro každou třídu.

(7)

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 7 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce 2018.

Obr. 7. Export ROI to shapefile.

Obr. 8. Editace náhodně vygenerovaných kontrolních bodů v ArcMap.

(8)

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 8 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce 2018.

Obr. 9. Náhodně vygenerovaný kontrolní pixel, kterému nelze jednoznačně přiřadit žádnou třídu legendy.

Hodnocení klasifikace v ENVI

Stejně jako tvorba náhodných kontrolních bodů se i přesnost klasifikace pomocí chybové matice dá hodnotit na základě kontrolních ROI nebo referenčního obrazu.

1. Confusion Matrix Using Ground Truth ROIs – v předchozí části jsme si ukázali dva způsoby, jak vygenerovat kontrolní body. Ať už máme tedy kontrolní body v ROI souboru nebo jako shapefile načtený do ENVI, postup vytvoření chybové matice je stejný. V nástroji Confusion Matrix Using Ground Truth ROIs nejprve vybereme výstup klasifikace, který chceme hodnotit, a otevře se další okno, ve kterém jsou ve sloupečku vpravo třídy klasifikovaného obrazu a ve sloupečku vlevo všechny otevřené ROI/shp data (pro přehlednost je dobré si pro hodnocení přesnosti klasifikace otevřít nové okno ENVI pouze s výstupem klasifikace a kontrolními body nebo udržovat striktní pořádek v pojmenovávání trénovacích a validačních dat, aby bylo zcela zřejmé, která jsou která).

Na uživateli je, aby vytvořil odpovídající si dvojice tříd v klasifikovaném obraze a v kontrolních bodech (viz obrázek 10a). Po přiřazení všech tříd v klasifikovaném obraze je třeba již pouze zvolit, zda zobrazit chybovou matici pouze v pixelech nebo i procentech (obrázek 10b) a prohlédnout si výsledek (obrázek 11), případně ho uložit do textového souboru pro další použití (File > Save Text to ASCII) .

a) b)

Obr. 10. a) Přiřazení tříd kontrolních bodů třídám ve výstupu klasifikace, b) Parametry chybové matice.

(9)

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 9 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce 2018.

Obr. 11. Chybová matice získaná nástrojem „Confusion Matrix Using Ground Truth ROIs“ pro zhodnocení řízené klasifikace Maximum Likelihood – MLC (viz výukový list Řízená klasifikace).

(10)

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 10 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce 2018.

2. Confusion Matrix Using Ground Truth Image – vzhledem k tomu, že referenční obraz většinou není k dispozici, jak již bylo zmíněno výše, využití této funkce k hodnocení přesnosti klasifikace je minimální. Avšak dá se využít například pro porovnání výstupů dvou klasifikací – řekne nám, kde se nachází rozdíly a kde jsou výsledky shodné (takže s větší pravděpodobností i správné). Nástroj funguje velmi podobně jako již popsaný Confusion Matrix Using Ground Truth ROIs (obrázek 12), ale kromě chybové matice vytvoří i chybové obrazy (Error Images), které pro každou třídu (a pro všechny třídy dohromady) ukazují, kde se klasifikace hodnocená shoduje s tou referenční (hodno- ta 0, černá) a kde se liší (hodnota 1, bílá) – ukázka pro porovnání řízené a neřízené klasifikace okolí Prahy je v obrázku 13.

Obr. 12. Confusion Matrix Using Ground Truth Image – dialogová okna.

(11)

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 11 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce 2018.

Řízená klasifikace MLC Neřízená klasifikace ISODATA

Error Image – Total Class Error Errror Image – listnaté a smíšené lesy

Obr. 13. Výstupy řízené (MLC) a neřízené (ISODATA) klasifikace a jejich porovnání pomocí „Confusion Matrix Using Ground Truth Image“. Levý dolní chybový obraz ukazuje veškeré pixely, které byly klasifikovány rozdíl-

ně, pravý dolní pak rozdíly ve výsledku klasifikace třídy listnaté a smíšené lesy.

Jak interpretovat získané výsledky?

Z chybové matice lze v reportu ENVI zjistit i celkovou přesnost a uživatelské a zpracovatelské přes- nosti pro každou z tříd. Chybová matice jde též uložit do textového souboru a načíst například do MS Office Excel, kde lze výsledky přepočítat i ručně. Co nám výsledné hodnoty řeknou, bylo popsáno již v teoretické části tohoto listu, ale prakticky si to ještě jednou ukážeme na příkladu zhodnocení přes- nosti řízené klasifikace MLC pomocí kontrolních bodů (obrázek 11 a 14).

(12)

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 12 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce 2018.

Kontrolních bodů pro hodnocení klasifikace MLC bylo celkem 73, což je celkem nízký počet a mů- že tak negativně ovlivňovat výsledky hodnocení přesnosti. Celková přesnost klasifikace dosáhla 80,82

% a kappa indexu 0,76, což je obstojný výsledek. Nejlépe byla klasifikována třída vodních ploch, která dosáhla dokonce 100% uživatelské přesnosti, což znamená, že by žádný pixel ve výsledné mapě kra- jinného pokryvu označený jako voda neměl být jiným pokryvem, avšak zpracovatelská přesnost této kategorie je již nižší (90,91 %), protože jeden pixel ve skutečnosti reprezentující vodní plochu byl kla- sifikátorem označen jako jehličnatý les. Zde se projevuje právě malý počet kontrolních bodů – se špatným zařazením pouze jednoho pixelu totiž zpracovatelská přesnost klesla hned o 10 %, kdyby bylo více kontrolních bodů, výsledky budou reprezentativnější. Nejhorších výsledků dosáhla třída antropogenních ploch – často do ní byly přidávány pixely (celkem 4) ve skutečnosti patřící orné půdě (uživatelská přesnost 69,23 %), to může poukazovat na to, že třída antropogenních povrchů ve vý- sledné klasifikaci zabírá větší rozlohu než v realitě (a to právě na úkor orné půdy). Naopak však do- cházelo k podobným chybám, i když pouze polovičním – některé antropogenní povrchy byly klasifiko- vány jako orná půda (2 pixely) nebo listnatý a smíšený les (1 pixel). Příčinou jsou podobné spektrální vlastnosti těchto povrchů. Co se týče lesů, tak velká část chyb se nachází mezi třídami jehličnatý les a listnatý a smíšený les – lze si všimnout, že třída jehličnatý les má vyšší zpracovatelskou přesnost a třída listnatý a smíšený les má vyšší uživatelskou přesnost, z toho by šlo soudit, že v realitě bude v klasifikovaném území méně pouze jehličnatých lesů, než je ve výsledné mapě.

Třída Antrop

plochy

Vodni plochy

Les jehlicnaty

Les listnaty smiseny

Orna puda,

TTP

Celkem

Uživatelská přesnost

(%)

antropogenni_plochy 9 0 0 0 4 13 69,23

vodni_plochy 0 10 0 0 0 10 100,00

les_jehlicnaty 0 1 11 3 0 15 73,33

les_listnaty_smiseny 1 0 1 13 0 15 86,67

orna_puda_TTP 2 0 0 2 16 20 80,00

Celkem 12 11 12 18 20 73 x

Zpracovatelská přesnost

(%) 75,00 90,91 91,67 72,22 80,00 x 80,82

Obr. 14. Chybová matice získaná nástrojem „Confusion Matrix Using Ground Truth ROIs“ pro zhodnocení řízené klasifikace MLC (viz výukový list Řízená klasifikace) a upravená v MS Office Excel.

Úkol

Zhodnoťte přesnost dříve vytvořené řízené a nařízené klasifikace (viz výukové listy Řízená klasifikace a Neřízená klasifikace) pro stejný snímek na základě jednoho souboru kontrolních bodů:

1. Náhodně si vygenerujte (Generate Random Sample Using Ground Truth Image) minimálně 10 bodů na jednu třídu krajinného pokryvu s tím, že více rozlehlé kategorie v obraze by měly mít bo- dů více (jako „Ground Truth Image“ použijte klasifikaci, která se vám zdá být přesnější). Určete třídu každému bodu na základě vizuální interpretace snímku Landsat, příp. použijte další zdroje dat, např. ortofota nebo GoogleEarth.

2. Na základě těchto bodů vygenerujte chybovou matici v SW ENVI (Confusion Matrix Using Ground Truth ROIs) postupně pro každý z klasifikačních výstupů (řízené klasifikace a neřízené klasifikace).

Z výstupu hodnocení přesnosti Vás bude zajímat vždy hlavně první matice, zbytek výsledků je z ní

(13)

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 13 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce 2018.

odvozený. Zkuste si z těchto prvních matic sami spočítat uživatelské, zpracovatelské a celkové přesnosti.

3. Na základě výsledků hodnocení přesnosti klasifikací uveďte, která z klasifikací vám vyšla celkově lépe a jestli byly rozdíly v přesnostech klasifikací jednotlivých tříd. Uveďte také, které třídy byly klasifikovány nejlépe a které nejhůře (a proč k tomu asi došlo). Rozloha jakých kategorií je v mapě

„přeceněna“ nebo naopak je jí tam méně než by být mělo?

4. Na závěr si ještě můžete porovnat obě klasifikace pomocí nástroje Confusion Matrix Using Ground Truth Image. Které ze tříd byly shodně klasifikovány pomocí obou klasifikátorů? A které naopak rozdílně? Porovnejte s výsledky hodnocení přesnosti obou klasifikací na základě kontrol- ních bodů.

Data ke cvičení

Výřez snímku pořízeného družicí Landsat 8, senzorem OLI, dne 3. 8. 2013 pro okolí Prahy:

L8_2013-08-03_Praha_1000x1000.dat (lze však použít i jakýkoli jiný družicový snímek), výstup řízené klasifikace Maximum Likelihood a výstup neřízené klasifikace ISODATA. Soubor kontrolních polygonů (shp).

Zdroje

[1] DOBROVOLNÝ, P. 1998. Dálkový průzkum Země, Digitální zpracování obrazu. 1. vyd. Brno: Masa- rykova univerzita v Brně, 1998. 210 s. ISBN: 80-210-1812-7.

[2] LILLESAND, T. M.; KIEFER R. W.; CHIPMAN, J. W. 2008. Remote Sensing and Image Interpretation.

6th ed. United States of America: Wiley, 2008. 756 s. ISBN: 978-0-470-05245-7.

[3] OLOFSSON, P. 2014. Accuracy Assessment and Area Estimation of Activity Data (prezentace).

GOFC-GOLD Regional Networks Workshop: Monitoring Land Change with Remote Sensing, Au- gust 4-15, 2014, Boston University.

Odkazy

Související dokumenty

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce 1 GIS a kartografie na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 1 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce

4.26 Lomová plocha (SEM) experimentálního materiálu lisovaného za studena při tlaku 500 MPa s následným slinováním při teplotě 400 °C (a) a detail částic (b).. Při

Graf č.. lékařské fakultě Univerzity Karlovy v Praze.. lékařské fakulty Univerzity Karlovy v Praze, magisterského oboru Ošetřovatelská péče v anesteziologii, resuscitaci

V roce 2005 získal doktorát teologie na Evangelické teologické fakultě Univerzity Karlovy v Praze a v roce 2006 začal pracovat jako odborný asistent katedry Starého

Tento výukový materiál vznikl v rámci projektu Moderní geoinformační metody ve výuce GIS, 1 kartografie a DPZ na Přírodovědecké fakultě Univerzity Karlovy v Praze v roce

Dalším parametrem vyžadujícím změnu je počet požadovaných spektrálních tříd, 5 – 10 je většinou málo, protože se vytvoří spektrální třídy, které

Cílem mé diplomové práce, kterou jsem zpracovávala na katedře parazitologie na Přírodovědecké fakultě Univerzity Karlovy v Praze, bylo prokázat aktivitu