• Nebyly nalezeny žádné výsledky

Regrese náhodným lesem

In document DIPLOMOVÁ PRÁCE (Stránka 39-43)

Pro pochopení metody náhodného regresního lesa je nejprve potřeba porozumět způ-sobu, jakým se sestavuje model klasifikačního a regresního stromu (Classification and Regression Tree, CART) na základě dané trénovací množiny pro libovolný regresní problém.

CART mají podobu binárních rozhodovacích stromů, jejichž rozhodovací pravi-dla jsou tvořena prahováním prvků množiny vstupních proměnných 𝑋. Terminální listy těchto stromů obsahují odhad výstupní proměnné𝑦. Strom se tvoří postupným přidáváním rozhodovacích uzlů, na kterých jsou prahovaná proměnná a konkrétní práh vybírány na základě minimalizace určité kriteriální funkce. Budeme-li o postup-ném prahování vstupních proměnných 𝑥1, ..., 𝑥𝑛 uvažovat jako o postupném dělení mnohorozměrného prostoru podél jednotlivých os odpovídajících těmto vstupním proměnným, můžeme v každém uzlu získat předběžný odhad výstupní proměnné ^𝑦 jako průměr všech vzorků výstupní proměnné v trénovací množině dat náchazejících se v odpovídajícím dosaženém podprostoru 𝑌𝑝 = {𝑦1, ..., 𝑦𝑚}. Kriteriální funkcí je poté suma kvadratických odchylek odhadu od všech vzorků v tomto podprostoru, tedy∑︀𝑚𝑖=1(^𝑦−𝑦𝑖)2. Pro každý uzel je tedy z celé dostupné množiny𝑋vybrána taková proměnná a takový práh, které tuto odchylku minimalizují. Tímto způsobem jsou uzly postupně přidávány až do splnění tzv. zastavovacího kritéria, kterým může být buď dosažení limitního počtu uzlů nebo dosažení bodu, ve kterém již další prahování nepřináší významné snížení kriteriální funkce (konvergence). Finální odhad stromu je poté opět průměr odpovídající množiny trénovacích vzorků 𝑌𝑝 na terminálním listu. Příklad jednoduché regrese na základě dvou vstupních proměnných pomocí CART je ilustrován na obrázku 3.2. [26]

Metoda náhodného regresního lesa je na těchto modelech založena, liší se však způsobem, jakým je sestavuje a vyhodnocuje. Prvním rozdílem je, že na každém rozhodovacím uzlu se vybírá optimální vstupní proměnná pouze z podmnožiny ná-hodně zvolené z kompletní množiny metodou bootstrapping (tj. vstupní proměnné se mohou v rámci jednoho rozhodovacího stromu opakovat, ač s rozdílně zvoleným pra-hem). Podobným způsobem je vybírána také podmnožina vzorků vstupních dat, na základě kterých se modely sestavují. Dále se potom metoda liší v počtu vytvořených modelů, kterých je obvykle několik desítek až stovek. Protože však každý obsahuje jinou téměř náhodnou posloupnost vstupních proměnných na svých uzlech a jinou

Obr. 3.2: Příklad CART. Prostor vstupních proměnných X (vlevo) a finální podoba rozhodovacího stromu (vpravo). [26]

množinu dat, podle které se určují prahy, zpracovává každý strom sadu dat jiným způsobem. Každý z vytvořených stromů tedy určuje finální odhad výstupní pro-měnné ^𝑦 jako průměr z odlišného podprostoru obsahujícího jiné vzorky trénovacích dat. Při předložení nové sady vstupních proměnných vytvořenému regresnímu lesa tedy dostaneme několik set různých odhadů, které se více či méně liší. Výsledným odhadem celého lesa je potom průměr těchto dílčích odhadů přes všechny vytvořené stromy, jak ilustruje obrázek 3.3. Jedná se tedy o metodu ze skupiny sborových metod strojového učení, které využívají faktu, že velký počet slabých predikčních modelů má tendenci chyby jednotlivých modelů vzájemně vyrušit. [9]

Obr. 3.3: Příklad náhodného regresního lesa se třemi rozhodovacími stromy.

Tento přístup činí výslednou regresi robustní vůči častým chybám jiných me-tod způsobeným přeučením regresního modelu, datům s nenormalizovanými rozsahy hodnot či se vzájemně korelovanými vstupními proměnnými. Metoda je také schopná

zachytit nelineární vztahy mezi vstupními proměnnými, což je žádoucí právě při apli-kacích na úlohy z oblasti umělé inteligence a analýzy obrazových dat. Nevýhodou potom může být velmi složitá nebo téměř nemožná interpretace vzniklého modelu.

Při vytváření modelu můžeme získat informaci o významnosti jednotlivých proměn-ných pro úspěšnost odhadu díky vzniklé vnitřní validační množiny při každém kroku bootstrappingu, nelze však odhadnout přesnější vztah mezi vstupními proměnnými.

Model se chová jako tzv. black box, což může být u některých úloh nežádoucí.

4 VLASTNÍ METODOLOGICKÉ ŘEŠENÍ

Cílem této kapitoly je návrh metody, která by pouze na základě běžně pořizovaných diagnostických CT dat dokázala plně automaticky určit hodnotu BMD a odhadnout stav kortexu těl obratlů pacienta. Algoritmy jsou navrženy a testovány na databázi onkologických pacientů. Výpočty by tedy mohly probíhat na pozadí například v době, kdy se radiolog zaměřuje na diagnózu metastáz. Po ukončení algoritmu by mělo být možné upozornit na zhoršený stav minerální kostní denzity nebo tloušťky kortexu přesto, že původní cíl vyšetření byl jiný. Algoritmus tedy musí být také robustní k výskytu patologiíí typických pro onkologické pacienty. Ačkoliv podrobná vizualizace výsledků například pomocí barevně kódovaných map může dát radiolo-govi lepší představu o celkovém stavu těla obratle, je žádoucí mít zároveň výstupy také ve formě číselných hodnot, které lze jednoduchým způsobem vyhodnotit jako fyziologické či rizikové a ve druhém případě radiologovi doporučit věnovat zvýšenou pozornost kvalitě kosti.

4.1 Dostupná data

Pro účely této práce bohužel nebyla k dispozici QCT data snímaná s kalibračním BMD fantomem, která by umožnila objektivní srovnání úspěšnosti jednotlivých me-tod stanovení BMD z diagnostických CT dat, popřípadě vývoj meme-tody nové. Pro porovnání metod mezi sebou byla poskytnuta data s expertem označenými oblastmi zájmu v kalibračních tkáních a v cílové oblasti trabekulární kosti lumbálních obratlů 16 pacientů (databáze 1, viz Obr 4.1). Označení bylo provedeno pro každý obratel ve třech řezech, což je v praxi používaná konvence pro diagnózu BMD výše uvedenou a v praxi používanou metodou 1. Ve snímcích je navíc pro každou označenou oblast zájmu přítomna hodnota CT čísla spočítaná z histogramu jasových hodnot interním softwarem CT stanice.

Kromě takto označených 2D řezů byly dále k dispozici kompletní volumetrická data páteří 48 onkologických pacientů (databáze 2, viz Obr 4.2). Tyto data obsa-hují také binární masky předběžně segmentovaných těl obratlů a pravděpodobnostní mapu výskytu blastických a lytických lézí. 7 z těchto pacientů dále obsahuje také segmentované masky paraspinálního svalu a subkutánního tuku (databáze 2’, viz Obr 4.3). Segmentované masky těchto tkání jsou potřebné pro výpočet BMD meto-dami zmíněnými v kapitole 2.1 a jejich automatické nalezení je předmětem paralelně vznikající práce Bc. Jakuba Šalplachty.

Obr. 4.1: Příklad snímku řezu jednoho obratle v databázi 1.

Obr. 4.2: Příklady výřezů dat v oblasti obratlů v databázi 2. Vlevo původní data, uprostřed binární maska segmentace a vpravo pravděpodobnostní mapa zdravé tkáně.

4.2 Návrh metodologie separace kortexu od

In document DIPLOMOVÁ PRÁCE (Stránka 39-43)