Prohl´ aˇ sen´ı autora pr´ ace

(1)

Automatická tvorba her typu puzzle na dotykovém zařízení s OS Android

Diplomová práce

Studijní program: Otevřená informatika (magisterský) Studijní obor: Počítačové vidění a digitální obraz Vedoucí práce: RNDr. Daniel Průša, Ph.D.

Bc. Václav Pruner

Praha 2015

Katedra kybernetiky

(2)

(3)

Katedra kybernetiky

ZADÁNÍ DIPLOMOVÉ PRÁCE

Student: Bc. Václav P r u n e r

Studijní program: Otevřená informatika (magisterský) Obor: Počítačové vidění a digitální obraz

Název tématu: Automatická tvorba her typu puzzle na dotykovém zařízení s OS Android

Pokyny pro vypracování:

Cílem práce je navrhnout aplikaci pro dotykové zařízení s OS Android, která bude

podporovat sestavování skládačky z dílků. Návrh konkrétní podoby skládačky je součástí práce. Kritériem je pouze zábavnost hry, nemusí se jednat o žádnou z tradičních variant.

Jako cílová skupina se předpokládá dítě ve věku 3-6 let. Významnou funkcionalitou bude automatická tvorba zadání podle zvoleného obrázku/fotografie. Na základě segmentace obrazu a dalšího zpracování budou detekovány signifikantní objekty, od kterých se bude odvíjet rozložení na dílky. Implementaci segmentace provede autor vlastní.

Úspěšnost a spolehlivost generování zadání bude analyzována pro různé typy vstupů.

Kromě implementace bude vytvořena uživatelská příručka a programátorská dokumentace.

Seznam odborné literatury:

[1] Šonka M., Hlaváč V., Boyle R.: Image Processing, Analysis and Machine vision, 3rd edition, Thomson Learning, Toronto, Canada, 2007.

[2] Nudelman G.: Android Design Patterns, 1st edition, Wiley, Indianapolis, USA, 2013.

Vedoucí diplomové práce: RNDr. Daniel Průša, Ph.D.

Platnost zadání: do konce letního semestru 2015/2016

L.S.

doc. Dr. Ing. Jan Kybic vedoucí katedry

prof. Ing. Pavel Ripka, CSc.

děkan V Praze dne 21. 1. 2015

(4)

(5)

Na tomto m´ıstˇe bych chtˇel podˇekovat panu RNDr. Danielu Pr˚uˇsovi, Ph.D. za vˇecné pˇripom´ınky a odborný dohled nad touto prac´ı. Dále bych chtˇel podˇekovat rodinˇe za podporu bˇehem celého studia.

Prohl´ aˇ sen´ı autora pr´ ace

Prohlaˇsuji, ˇze jsem pˇredloˇzenou práci vypracoval samostatnˇe a ˇze jsem uvedl veˇskeré pouˇzité informaˇcn´ı zdroje v souladu s Metodickým pokynem o dodrˇzován´ı etických princip˚u pˇri pˇr´ıpravˇe vysokoˇskolských závˇereˇcných prac´ı.

V Praze dne . . . . Podpis autora pr´ace

(6)

C´ılem této práce je vyvinut´ı aplikace pro zaˇr´ızen´ı s operaˇcn´ım systémem An- droid, která automaticky vytvoˇr´ı hru typu puzzle pro libovolný vstupn´ı obrázek.

Jednotlivé d´ılky skládanky by mˇely reflektovat objekty v pˇr´ısluˇsném vstupu.

Automatická tvorba je zaloˇzena na segmentaci obrazu a kompaktnosti geome- trických útvar˚u. C´ılovou skupinou jsou dˇeti pˇribliˇznˇe ve vˇeku od tˇr´ı do ˇsesti let.

Kl´ıˇ cov´ a slova

segmentace obrazu, kompaktnost geometrick´ych ´utvar˚u, Android

Abstract

The goal of this thesis is to develop an application for devices with Android operating system, which automatically creates a puzzle game for arbitrary input image. Every piece of the puzzle should reflect objects in its respective input. Automatic creation is based on image segmentation and compactness of geometric shapes. The target group are children from about three to six years old.

Keywords

image segmentation, geometric shape compactness, Android

(7)

1 Uvod´ 11

2 Souˇcasn´y stav 13

3 Algoritmus 15

3.1 Pˇredzpracov´an´ı obrazu . . . 15

3.1.1 Interpolace pomoc´ı nejbliˇzˇs´ıho souseda . . . 17

3.1.2 Biline´arn´ı interpolace . . . 17

3.1.3 Bikubick´a interpolace . . . 18

3.1.4 Porovn´an´ı metod . . . 19

3.2 Segmentace . . . 20

3.2.1 Zvaˇzovan´e metody . . . 22

3.2.2 Barevn´y model HSV . . . 23

3.2.3 Algoritmus zdol´av´an´ı kopc˚u (Hill-Climbing) . . . 24

3.3 Prvn´ı dˇelen´ı na z´akladˇe velikosti . . . 26

3.4 Prostorové oddˇelen´ı segment˚u a druhé dˇelen´ı na základˇe velikosti 27 3.5 Kritérium pro vyb´ırán´ı segment˚u . . . 31

3.5.1 V´ypoˇcet kompaktnosti geometrick´eho tvaru . . . 31

3.5.2 V´ypoˇcet IP Q indexu . . . 33

3.6 Operace ovlivˇnuj´ıc´ıIP Qindex . . . 37

3.6.1 Matematick´a morfologie . . . 37

3.6.2 Zaplˇnov´an´ı velk´ych dˇer . . . 40

3.6.3 V´ysledky operac´ı . . . 42

3.7 Vyb´ır´an´ı segment˚u podle IP Qindexu . . . 42

3.7.1 V´ybˇer kompaktn´ıch segment˚u - 1. pr˚uchod . . . 42

3.7.2 Rozdˇelen´ı pˇr´ıliˇs velk´ych segment˚u . . . 45

3.7.3 V´ybˇer kompaktn´ıch segment˚u - 2. pr˚uchod . . . 46

3.8 Tvorba dodateˇcn´ych segment˚u . . . 46

3.9 Fin´aln´ı ´uprava segment˚u . . . 48

3.10 Rozmazán´ı vyseparovaných ˇcást´ı ve vstupn´ım obrázku . . . 49

(8)

4.1 Struktura aplikace . . . 55

4.2 Funkˇcn´ı vlastnosti aplikace . . . 57

4.2.1 Skládán´ı skládanky . . . 57

4.2.2 Zpracov´an´ı obr´azku . . . 58

4.2.3 V´ybˇer vstupn´ıho obr´azku . . . 59

4.2.4 Uloˇzen´ı skl´adanky . . . 59

4.2.5 Naˇcten´ı uloˇzen´e skl´adanky . . . 60

5 Testov´an´ı 63 5.1 Okolnosti ovlivˇnuj´ıc´ı segmentaci obrazu . . . 63

5.2 Testov´an´ı s uˇzivateli . . . 66

6 Z´avˇer 67

Literatura 69

A Ovl´ad´an´ı aplikace 73

B Seznam pouˇzit´ych zkratek 77

C Obsah pˇriloˇzen´eho DVD 79

(9)

1 Animal Jigsaw Puzzles For Kids . . . 13

2 Toddlers Puzzle Woozzle . . . 14

3 V´yvojov´y diagram algoritmu . . . 16

4 Vliv pˇridˇelen´eho poˇctu pixel˚u na zachov´an´ı tvar˚u v obraze . . 16

5 Biline´arn´ı interpolace - hodnota nov´eho pixelu . . . 17

6 Bikubick´a interpolace - hodnota nov´eho pixelu . . . 18

7 Interpolaˇcn´ı j´adra . . . 19

8 Porovn´an´ı interpolaˇcn´ıch metod . . . 21

9 Barevn´y model HSV . . . 23

10 Zn´azornˇen´ı indexace pixel˚u (obr´azek o rozmˇerech 4x3) . . . . 24

11 Hill-Climbing algoritmus . . . 26

12 Prvn´ı dˇelen´ı na z´akladˇe velikosti . . . 27

13 Prostorovˇe neoddˇelen´e segmenty . . . 27

14 Okol´ı pixelu (o) pouˇzit´e pˇri prostorov´em dˇelen´ı . . . 28

15 Pˇr´ıklad oddˇelovan´eho segmentu . . . 29

16 Hodnoty matice rastr po tˇrech kroc´ıch algoritmu . . . 29

17 Koneˇcn´e hodnoty matice rastr . . . 29

18 Freeman˚uv ˇretˇezov´y k´od . . . 34

19 Pˇr´ıklad popisu hranice objektu . . . 34

20 Pˇr´ıklad segmentu . . . 35

21 Porovn´an´ı metod na mˇeˇren´ı obvodu . . . 36

22 Pˇr´ıklad segmentu jako bin´arn´ıho obrazu . . . 37

23 Nejˇcastˇeji pouˇz´ıvan´e strukturn´ı elementy . . . 38

24 Posunut´ı o radiusvektor . . . 38

25 Transpozice . . . 38

26 Bin´arn´ı dilatace . . . 39

27 Bin´arn´ı eroze . . . 39

28 Pouˇzit´y strukturn´ı element B . . . 40

29 Vývojový diagram vyplˇnován´ı segment˚u . . . 40

30 Zmˇena indexu v závislosti na hodnotˇe ˇretˇezového kódu . . . . 41

31 Zlepˇsov´an´ı vlastnost´ı segmentu. . . 43

(10)

33 Neˇz´adouc´ı efekt dˇelen´ı velk´ych segment˚u. . . 45

34 Vývojový diagram tvorby dodateˇcných segment˚u . . . 47

35 Pˇr´ıklad segmentu jako bin´arn´ıho obrazu . . . 49

36 Rozmazán´ı vyseparovaných ˇcást´ı ve vstupn´ım obrázku . . . . 51

37 Pod´ıl operaˇcn´ıch syst´em˚u na trhu v roce 2014 . . . 53

38 Srovn´an´ı zastoupen´ı verz´ı OS Android v listopadu 2014 a dubnu 2015 . . . 54

39 Hlavn´ı aktivitaMainActivity . . . 55

40 Ostatn´ı aktivity . . . 56

41 Diagram uˇzit´ı . . . 57

42 Sekvenˇcn´ı diagram zpracov´an´ı obr´azku . . . 58

43 Sekvenˇcn´ı diagram v´ybˇeru obr´azku . . . 59

44 Sekvenˇcn´ı diagram uloˇzen´ı skl´adanky . . . 59

45 Sekvenˇcn´ı diagram naˇcten´ı uloˇzen´e skl´adanky . . . 61

46 Prototypy vstupn´ıch obr´azk˚u . . . 63

47 Porovnán´ı segmentace pro r˚uzné vstupn´ı formáty . . . 64

48 Rozliˇsov´an´ı odst´ın˚u pˇri segmentaci . . . 65

49 Hodnocen´ı uˇzivatel˚u . . . 66

50 V´ychoz´ı obrazovka . . . 73

51 Ovl´ad´an´ı aplikace . . . 73

52 Pr˚ubˇeh zpracov´an´ı . . . 74

53 Potvrzen´ı uloˇzen´ı . . . 74

54 Dlaˇzdicov´a galerie pro naˇc´ıt´an´ı . . . 75

55 Obsah pˇriloˇzen´eho DVD . . . 79

(11)

Kapitola 1 Uvod ´

Chytré telefony a tablety si v souˇcasné dobˇe uˇz´ıvaj´ı znaˇcné popularity, která, jak se zdá, bude dále jen r˚ust. S t´ım je spojen i vzr˚ustaj´ıc´ı zájem o vývoj aplikac´ı pro tato zaˇr´ızen´ı, který byl i pohnutkou pro výbˇer tématu - apli- kován´ı velmi ˇcasto výpoˇcetnˇe nároˇcných metod poˇc´ıtaˇcového vidˇen´ı na mo- biln´ıch zaˇr´ızen´ıch, která maj´ı menˇs´ı výpoˇcetn´ı výkon a pamˇet’ové moˇznosti neˇz poˇc´ıtaˇce.

C´ılem práce bylo navrhnout aplikaci pro zaˇr´ızen´ı s operaˇcn´ım systémem An- droid, která pro libovolný vstupn´ı obrázek vytvoˇr´ı hru typu puzzle; c´ılovou skupinou jsou dˇeti ve vˇeku od tˇr´ı do ˇsesti let. Jednotlivé d´ılky, nalezené ve vstupu metodami poˇc´ıtaˇcového vidˇen´ı, by mˇely reflektovat koherentn´ı objekty v obraze. Kompletn´ı seznam základn´ıch poˇzadavk˚u na vyv´ıjenou aplikaci je následuj´ıc´ı:

• Uˇzivatel má moˇznost vybrat libovolný vstupn´ı obrázek

• Uˇzivatel má moˇznost uloˇzit stávaj´ıc´ı skládanku

• Uˇzivatel má moˇznost naˇc´ıst dˇr´ıve uloˇzenou skládanku Vlastn´ı hran´ı hry prob´ıhá

”vlepován´ım“ vytvoˇrených d´ılk˚u zpˇet do p˚uvodn´ıho obrázku operac´ı

”uchopit a t´ahnout“ (

”Drag & Drop“). Pˇri vývoji byl kladen d˚uraz zejména na návrh algoritmu, který výslednou skládanku vytvoˇr´ı.

(12)

(13)

Kapitola 2

Souˇ casn´ y stav

Aplikace pro operaˇcn´ı systém Android jsou distribuované sluˇzbou Google Play[1], konkrétnˇe jej´ı sekc´ı Google Play Store (existuj´ı jeˇstˇe sekce Google Play Music pro distribuci hudby, Google Play Movies & TV pro distribuci vide´ı a Goo- gle Play Books pro distribuci elektronických knih[2]). Sluˇzba Google Play je dostupná z kaˇzdého zaˇr´ızen´ı vybaveného operaˇcn´ım systémem Android.

Google Play obsahuje velké mnoˇzstv´ı her typu puzzle pro dˇeti, které jsou ovˇsem pouze variacemi na dvˇe varianty. Prvn´ı variantou jsou aplikace na základˇe kla- sických fyzických puzzl˚u, jedná se tedy o pouhé rozˇrezán´ı obrázku. Pˇr´ıkladem m˚uˇze být aplikace Animal Jigsaw Puzzles For Kids[3], viz Obr.1.

Obr. 1Animal Jigsaw Puzzles For Kids

Druhá varianta se principiálnˇe pˇribliˇzuje poˇzadavk˚um na zadán´ı této práce - jedná se o

”vlepován´ı“ vyˇr´ızlých objekt˚u zpˇet do p˚uvodn´ıho obrázku, tvorba výˇrez˚u ovˇsem neprob´ıhá automaticky a dvojice obrázek - výˇrezy jsou dodány vývojáˇrem aplikace.

(14)

Obr. 2Toddlers Puzzle Woozzle

Z´astupcem tohoto typu skl´adanek je napˇr´ıklad hra Toddlers Puzzle Woozzle[4], viz Obr.2.

Aplikace, která byla vyv´ıjena jako c´ıl této práce, tedy nemá v distribuˇcn´ı sluˇzbˇe Google Play zastoupen´ı.

(15)

Kapitola 3 Algoritmus

Vstupem pouˇzitého algoritmu (viz. vývojový diagram Obr.3) je vybraný obrázek, pˇresnˇeji pole s RGB hodnotami jeho pixel˚u. Výstupem jsou indexy vyseparo- vaných obrazc˚u (kaˇzdý obrazec má seznam index˚u svých pixel˚u) a obrázek, který je na vyseparovaných pozic´ıch rozmazán (opˇet jde tedy o pole s RGB hodnotami jeho pixel˚u).

Vstupn´ı obrázek je nejprve zmenˇsen kv˚uli urychlen´ı výpoˇcetn´ıch ˇcas˚u, poté je provedena segmentace a prostorové oddˇelen´ı vzniknuvˇs´ıch segment˚u. U segment˚u správné velikosti (tzn. ani pˇr´ıliˇs malých ani pˇr´ıliˇs velkých) je poté po- rovnána jejich kompaktnost s pˇredem stanoveným kompaktnostn´ım prahem.

Pˇrijaté segmenty jsou nakonec zvˇetˇseny zpátky na p˚uvodn´ı velikost vstupn´ıho obrázku, který je na jejich pozic´ıch rozmazán.

3.1 Pˇ redzpracov´ an´ı obrazu

Aby algoritmus pracoval v pˇrijatelných ˇcasových relac´ıch je tˇreba vstupn´ı obraz nejprve zmenˇsit. Na jeden sn´ımek je alokováno pˇribliˇznˇe 250 tis´ıc pixel˚u.

Obraz s pomˇerem stran 4:3 bude m´ıt po takov´emto zmenˇsen´ı rozmˇery pˇribliˇznˇe 580px x 430px, obraz s pomˇerem stran 16:9 pˇribliˇznˇe 680px x 380px a obraz s pomˇerem stran 16:10 pˇribliˇznˇe 640px x 400px.

Alokován´ı menˇs´ıho poˇctu pixel˚u vede sice k rychlejˇs´ım výpoˇcetn´ım ˇcas˚um, docház´ı nicménˇe ke zkreslen´ı objekt˚u ve scénˇe (zejména jejich hranic), viz.

Obr.4. Analogicky vˇetˇs´ı poˇcet pixel˚u vede k delˇs´ımu trván´ı výpoˇctu a k lepˇs´ımu zachován´ı tvar˚u.

Jako algoritmy ke zmenˇsen´ı velikosti obrazu byly zvaˇzovány interpolace pomoc´ı nejbliˇzˇs´ıho souseda, bilineárn´ı interpolace a bikubická interpolace.

(16)

Pˇred- zpracov´an´ı

obrazu

Segmentace Prvn´ı dˇelˇen´ı podle velikosti

Prostorov´e oddˇelen´ı segment˚u

Druh´e dˇelen´ı podle velikosti

Aplikace bin´arn´ı morfologie a vyplnˇen´ı segment˚u

V´ybˇer kompaktn´ıch segment˚u -

1.pr˚uchod

Rozdˇelen´ı velk´ych segment˚u

V´ybˇer kompaktn´ıch segment˚u -

2.pr˚uchod

Tvorba do- dateˇcn´ych

segment˚u

Fin´aln´ı ´uprava segment˚u

Rozmazán´ı vyseparo- vaných ˇcást´ı

Obr. 3V´yvojov´y diagram algoritmu

(a) rozmˇery 633px x 475px (b) rozmˇery 200px x 150px Obr. 4Vliv pˇridˇelen´eho poˇctu pixel˚u na zachov´an´ı tvar˚u v obraze

(17)

3.1.1 Interpolace pomoc´ı nejbliˇ zˇ s´ıho souseda

Jak jiˇz název napov´ıdá, interpolace pomoc´ı nejbliˇzˇs´ıho souseda (Nearest nei- ghbour interpolation)[5][7] pˇriˇrad´ı na interpolovanou pozici hodnotu intenzity nejbliˇzˇs´ıho pixelu. Nevýhoda, této jinak pˇr´ımoˇcaré metody, je tvorba

”schod˚u“

u objekt˚u s ostr´ymi hranicemi (patrnˇejˇs´ı u zvˇetˇsov´an´ı obrazu).

3.1.2 Biline´ arn´ı interpolace

Bilineárn´ı interpolace (Bilinear interpolation)[5][6] pˇredpokládá, ˇze funkce intenzity je lineárn´ı ve svém okol´ı a hodnotu intenzity interpolovaného pixelu poˇc´ıtá jako váˇzený pr˚umˇer ˇctyˇrech okoln´ıch pixel˚u z p˚uvodn´ıho obrazu.

Konkrétnˇe je hodnota intenzity interpolovaného pixelu J(r⁰, c⁰) vypoˇc´ıtána podle vzorce

J(r⁰, c⁰) =I(r, c)·(1− 4r)·(1− 4c) +I(r+ 1, c)· 4r·(1− 4c) +I(r, c+ 1)·(1− 4r)· 4c +I(r+ 1, c+ 1)· 4r· 4c

kde I(x,y) udává hodnotu intenzity p˚uvodn´ıho pixelu na souˇradnic´ıch (x, y), význam ostatn´ıch promˇenných je patrný z Obr.5. Bilineárn´ı interpolace m˚uˇze

Obr. 5Biline´arn´ı interpolace - hodnota nov´eho pixelu

d´ıky povaze pr˚umˇerován´ı zp˚usobit rozmazán´ı, redukuje efekt ”schod˚u”pˇredsta- vený u interpolace pomoc´ı nejbliˇzˇs´ıho souseda.

(18)

3.1.3 Bikubick´ a interpolace

Bikubická interpolace[5][7][8] jeˇstˇe dále zpˇresˇnuje hodnotu intenzity interpolo- vaného pixelu t´ım, ˇze bere v úvahu ˇsestnáct sousedn´ıch pixel˚u z p˚uvodn´ıho obrazu (viz. Obr.6). Obecnˇe se hodnota intenzity interpolovaného pixeluJ(r’,c’) vypoˇcte podle vzorce

J(r⁰, c⁰) =

2

X

m=−1 2

X

n=−1

I(r+m, c+n)·Rc(m− 4r)·Rc(4c−n)

Obdobnˇe jako u bilineárn´ı interpolace udává I(x,y) hodnotu intenzity pixelu na souˇradnic´ıch (x,y) v p˚uvodn´ım obrazu, význam 4r a 4cje moˇzno odeˇc´ıst z Obr.6; funkce R_c (interpolaˇcn´ı funkce ˇci interpolaˇcn´ı jádro) udává váhy in- tenzit kaˇzdého z ˇsestnácti sousedn´ıch pixel˚u p˚uvodn´ıho obrazu ve výsledné sumˇe, z ˇcehoˇz plyne, ˇze volbou vhodné funkce R_c lze vyjádˇrit i bilineárn´ı interpolaci a interpolaci pomoc´ı nejbliˇzˇs´ıho souseda.

Obr. 6Bikubick´a interpolace - hodnota nov´eho pixelu

Jednou z ˇcasto pouˇz´ıvaných funkc´ı je funkce typu Bell[7][8], viz. Obr.7(a) (i kdyˇz se v pravém slova smyslu nejedná o bikubickou interpolaci, jelikoˇz

(19)

pˇredpis neobsahuje ˇz´adnou mocninu tˇr´ı)

Rc(x) =









 1

2 x+3 2

!2

−3

2≤x≤ −1 2 3

4−x² −1

2≤x≤ 1 2 1

2 x− 3 2

!2

1

2≤x≤ −3 2

0 jinak

Dalˇs´ı ˇcasto pouˇz´ıvaným jádrem je Jádro CatMull-Rom[7][9], viz. Obr.7(b)

R_c(x) =











9|x|³−15|x|²+ 6 |x|<1

−3|x|³+ 15|x|²−24|x|+ 12 1≤ |x|<2

0 jinak

Bikubická interpolace se dokáˇze vypoˇrádat s efektem ”schod˚u”interpolace

(a) Bell (b) CatMull-Rom

Obr. 7Interpolaˇcn´ı j´adra

pomoc´ı nejbliˇzˇs´ıho souseda a potlaˇcuje i rozmazán´ı pˇr´ıtomné u bilineárn´ı interpolace. Na prvn´ı pohled je vˇsak patrné, ˇze je ˇcasovˇe nároˇcnˇejˇs´ı neˇz pˇredeˇslé dva zp˚usoby.

3.1.4 Porovn´ an´ı metod

Porovnán´ı výˇse zm´ınˇených ˇctyˇrech metod je demonstrováno na Obr.8. P˚uvodn´ı obrázek Obr.8(a) o velikosti 3392px x 3328px byl zmenˇsen pomoc´ı kaˇzdé z výˇse zm´ınˇených metod na rozmˇery 500px x 428px. Na sn´ımc´ıch Obr.8(b) aˇz Obr.8(e) je detail (zvýraznˇený zeleným obdéln´ıkem na Obr.8(a)) kaˇzdé této zmenˇseniny.

Je vidˇet, ˇze s pokroˇcilejˇs´ı metodou docház´ı k postupnému zlepˇsován´ı úrovnˇe

(20)

interpolovan´eho obrazu, zejm´ena na hranici objektu.

Pˇrestoˇze bikubická interpolace produkuje z pohledu lidského vn´ımán´ı obrazu nejlepˇs´ı výsledky, byla jako metoda pro pˇredzpracován´ı (pˇresnˇeji zmenˇsen´ı) obrazu zvolena bilineárn´ı interpolace. Jev´ı se totiˇz jako vhodný kompromis mezi rychlost´ı a výkonem. Nav´ıc u zmenˇsován´ı obrazu nejsou nedostatky tolik patrné (Obr.5 zámˇernˇe zveliˇcuje tyto nedostatky pˇribl´ıˇzen´ım ˇcásti zmenˇseného sn´ımku).

3.2 Segmentace

Segmentace obrazu[5] obnáˇs´ı rozdˇelen´ı obrazu na oblasti, které silnˇe koreluj´ı s reálnými objekty ˇci oblastmi obsaˇzenými v obraze. Nejˇcastˇeji se jako roz- hoduj´ıc´ı atribut pouˇz´ıvá hodnota intenzity pro jednobarevné obrazy a jednot- livé komponenty barev (napˇr. kaˇzdý z kanál˚u RGB barevného schématu) pro v´ıcebarevné obrazy[8].

Neexistuje ˇzádná ucelená teorie o segmentaci obrazu[8], následkem ˇcehoˇz ne- vznikla pouze jediná univerzáln´ı metoda pro tento problém. Existuje vˇetˇs´ı mnoˇzstv´ı metod, které vznikly jako ˇreˇsen´ı urˇcitého problému a postupnˇe z´ıskaly na popularitˇe. Protoˇze existuje velké mnoˇzstv´ı segmentaˇcn´ıch metod, je tˇreba nˇejak hodnotit jejich výsledky. Haralick a Shapiro[10] stanovili, ˇze segmenty by mˇely splˇnovat následuj´ıc´ı vlastnosti

• Oblasti segment˚u by mˇely b´yt uniformn´ı a homogenn´ı

• Vnitˇrky segment˚u by nemˇely obsahovat mnoho mal´ych dˇer

• Hranice kaˇzdého segmentu by mˇely být jednoduché, prostorovˇe pˇresné a pokud moˇzno nepˇr´ıliˇs ˇclenité

• Sousedn´ı segmenty by mˇely být co nejv´ıce rozd´ılné (s ohledem na seg- mentaˇcn´ı atribut, podle kterého je oblast segmentu uniformn´ı)

Jeden ze zp˚usob˚u jak hodnotit segmentaˇcn´ı metody pˇredpokládá, ˇze správná segmentace je známa pˇredem. Výsledky mˇeˇrené metody jsou potom porovnávány s touto ”ground truth”. Tento postup je vˇsak velmi pracný[5] a nav´ıc pro vze- vrubné posouzen´ı metody, je tˇreba m´ıt objemnou databázi takovýchto obraz˚u (nejznámˇejˇs´ı je nejsp´ıˇse The Berkeley Segmentation Dataset [11]).

Dalˇs´ım ze zp˚usob˚u je hodnocen´ı bez dohledu (unsupervised evaluation), který je ovˇsem zpravidla testován na syntetických datasetech a na vlastnosti obraz˚u zavád´ı restrikce, které ˇcasto nemohou být pouˇzité v aplikac´ıch z reálného svˇeta.[5]

(21)

(a) P˚uvodn´ı obraz

(b) Nejbliˇzˇs´ı soused (c) Biline´arn´ı int.

(d) Bell (e) Catmul-Rom

Obr. 8Porovn´an´ı interpolaˇcn´ıch metod

(22)

Momentálnˇe vˇsak neexistuje ˇzádný konsensus o tom, jak tyto metody hodnotit.

Pro praktick´e pouˇzit´ı se zpravidla zodpov´ıdaj´ı tˇri ot´azky[5]

1. Jak ˇcasto metoda selˇze (tzn. metoda nedá rozumný výsledek) 2. Jak pˇresná metoda je

3. Do jaké m´ıry je metoda reprodukovatelná na úspˇeˇsných pˇr´ıpadech

3.2.1 Zvaˇ zovan´ e metody

Jak jiˇz bylo zm´ınˇeno výˇse, existuje nepˇreberné mnoˇzstv´ı metod, které dokáˇz´ı obraz segmentovat. Prvn´ım zvaˇzovaným algoritmem byla, na základˇe doporuˇcen´ı vedouc´ıho práce, segmentace s vyuˇzit´ım hledán´ı minimáln´ıho ˇrezu (maximáln´ıho tok) grafu - GrabCut[12]. Tato metoda je inicializována nalezen´ım bod˚u náleˇz´ıc´ıch pozad´ı a popˇred´ı, které slouˇz´ı jako pevné omezen´ı (hard constraint); dodateˇcná flexibiln´ı omezen´ı (soft constraints) mohou být zavedena, aby reflektovala in- formaci o oblastech nebo hranic´ıch objekt˚u. Vzhledem k tomu, ˇze tato metoda segmentuje obraz pouze na pozad´ı a popˇred´ı a ˇze poˇzadovaný algoritmus by mˇel být plnˇe automatický, byla nakonec segmentace s vyuˇzit´ım hledán´ı mi- nimáln´ıho ˇrezu grafu zam´ıtnuta.

Dalˇs´ım zvaˇzovaným algoritmem bylo velmi rozˇs´ıˇrené shlukován´ı pomoc´ı k- means[5], které lze popsat následovnˇe

1. V obrazu je vybr´ano (v nejprimitivnˇejˇs´ı verzi n´ahodnˇe) k bod˚u - centroid˚u

2. Kaˇzdý bod obrazu je pˇriˇrazen ke svému nejbliˇzˇs´ımu stˇredu (nejbliˇzˇs´ımu ve smyslu zvolené metriky, ˇcasto pouˇz´ıvanou je euklidovská vzdálenost) 3. Pro kaˇzdý takto vzniklý shluk je pr˚umˇerován´ım vypoˇcten nový centroid

a shlukov´an´ı zaˇc´ına od 1. kroku

K-means iteruje dokud nedojde ke zmˇenˇe ˇzádného shluku (ideáln´ı pˇr´ıpad) nebo dokud nen´ı pˇrekroˇcen poˇcet pˇredem daných iterac´ı. Úskal´ım této metody je volba parametru k, který udává celkový poˇcet shluk˚u. Existuj´ı sice metody na automatické zjiˇstˇen´ık (napˇr´ıklad pomoc´ı detekce hran [13] nebo porovnán´ım segment˚u pro r˚uzná k[14]), zavádˇej´ı ovˇsem dalˇs´ı vrstvu komplexity do celého algoritmu. Nav´ıc k-means velmi ˇcasto konverguj´ı k lokáln´ımu optimu, ˇc´ımˇz docház´ı ke ztrátˇe poˇctu segment˚u a nepˇresnostem v segmentaci.

Nakonec byl zvolen algoritmus zdoláván´ı kopc˚u (Hill-Climbing), který dosáhne segmentace hledán´ım lokáln´ıch maxim v trojrozmˇerném histogramu[15].

(23)

3.2.2 Barevn´ y model HSV

Dobrý barevný model pro segmentaci obrazu by mˇel splˇnovat vlastnost, ˇze vn´ımaná rozd´ılnost barev odpov´ıdá jejich euklidovské vzdálenosti v tomto modelu. HSV barevný model tuto vlastnost splˇnuje a nav´ıc velmi dobˇre odpov´ıdá lidskému vn´ımán´ı barev[15]. Barevný model HSV je podobnˇe jako RGB tˇr´ısloˇzkový - H (hue) je odst´ın barvy, S (satruation) sytost barvy a V (value) pˇredstavuje jas v porovnán´ı s b´ılou barvou.

Obr. 9Barevn´y model HSV

Na Obr.9[15] je barevný HSV model znázornˇený - H jako hodnota na barevném kotouˇci, S urˇcuje pozici na kotouˇci od stˇredu a V je pozice barevného kotouˇce na ose ˇcerná-b´ılá.

RGB hodnoty se na HSV pˇrevedou podle n´asledn´ych vztah˚u[16]

R⁰ = R

255, G⁰ = G

255, B⁰ = B 255 C_max = max{R⁰, G⁰, B⁰}

C_min = min{R⁰, G⁰, B⁰} 4=Cmax−Cmin

(24)

H =











0 4= 0

60 G⁰ −B⁰

4 mod 6

!

C_max=R⁰

60 B⁰−R⁰ 4 + 2

!

C_max=G⁰ 60 R⁰−G⁰

4 + 4

!

C_max=B⁰

S =











0 C_max = 0

4

C_max C_max 6= 0 V =C_max

3.2.3 Algoritmus zdol´ av´ an´ı kopc˚ u (Hill-Climbing)

Vstupem zvoleného segmentaˇcn´ıho algortimu[15] je pole s RGB hodnotami pixel˚u zpracovávaného obrazu, kde poˇrad´ı v poli odpov´ıdá um´ıstˇen´ı pixelu v obraze (viz. Obr.10). Výstupem je pole clusters stejné velikosti jako vstup, které obsahuje rozˇrazen´ı pixel˚u do segment˚u -clusters(i) =j znamená, ˇzei-tý pixel náleˇz´ıj-tému shluku.

0 1 2 3

4 5 6 7

8 9 10 11

Obr. 10 Zn´azornˇen´ı indexace pixel˚u (obr´azek o rozmˇerech 4x3)

RGB hodnoty jsou pˇrevedeny do HSV a upraveny tak, aby nejmenˇs´ı hodnota kaˇzdé sloˇzky byla 0 a nejvˇetˇs´ı hodnota kaˇzdé sloˇzky 1 (tedy nafitován´ı do intervalu h0,1i) a poté je pomoc´ı Hill-Climbing algoritmu provedená segmentace.

Jednorozmˇerný Hill-Climbing algoritmus pro H sloˇzku vypadá následovnˇe.

1. Vytvoˇren´ı jednorozmˇern´eho barevn´eho histogramu.

(25)

2. Zdoláván´ı kopce - zaˇc´ıná se na libovolném nenulovém binu (tj. datovém intervalu) a podle následuj´ıc´ıch pravidel, se hledá vrchol (kopec), tj.

lok´aln´ı maximum v histogramu

(a) Porovnán´ı poˇctu pixel˚u aktuáln´ıho binu s jeho levým a pravým sou- sedem. Je d˚uleˇzité si uvˇedomit, ˇze H sloˇzka je hodnota na barevném kotouˇci (Obr.6) a tedy levý krajn´ı bin soused´ı s pravým krajn´ım bi- nem.

(b) Pokud maj´ı sousedn´ı biny rozd´ıln´y poˇcet pixel˚u, dojde k pˇresunu vzh˚uru k binu s vˇetˇs´ım poˇctem pixel˚u.

(c) Pokud maj´ı sousedn´ı biny stejný poˇcet pixel˚u, dojde k posouván´ı na dalˇs´ı sousedy, dokud nejsou nalezeny biny s rozd´ılným poˇctem pixel˚u. Pˇresun vzh˚uru je proveden na bin s vˇetˇs´ım poˇctem pixel˚u.

(d) Postup 2(a)-2(c) je opakován, dokud nedojde k nalezen´ı binu, z kterého jiˇz ˇzádným zp˚usobem nen´ı moˇzný pohyb vzh˚uru, tj. sousedn´ı biny obsahuj´ı menˇs´ı poˇcet pixel˚u. Tento bin je indentifikován jako peak (vrchol ˇci kopec), jedná se o lokáln´ı maximum v histogramu 3. Je zvolen dalˇs´ı libovolný nenulový, avˇsak dosud nezpracovaný, bin a je

zopakov´an krok ˇc´ıslo 2. Tento krok se opakuje, dokud nejsou zpracov´any vˇsechny biny histogramu.

4. Identifikovan´a lok´aln´ı maxima pˇredstavuj´ı poˇcet shluk˚u v obraze (pozn.

tato metoda by tedy mohla b´yt jednou z dalˇs´ıch moˇznost´ı automatizace segmentace pomoc´ı k-means shlukov´an´ı)

5. Jednotlivé biny jsou pˇriˇrazeny k tomu lokáln´ımu maximu, ke kterému se doˇslo v kroce 2; t´ımto je segmentace hotova.

Obr.11[15] znázorˇnuje pr˚ubˇeh algoritmu - (a) hledán´ı vrchol˚u (peak˚u), (b) pˇriˇrazován´ı bin˚u k vrchol˚um.

Zobecnˇen´ı tohoto postupu do tˇr´ı rozmˇer˚u (tedy pro vˇsechny tˇri sloˇzky HSV) je pˇr´ımoˇcaré. V 1. kroce je vytvoˇren trojrozmˇerný histogram m´ısto jedno- rozmˇerného a ve 2. kroce se pouze liˇs´ı poˇcet sousedn´ıch bin˚u, se kterými se porovnává poˇcet jejich pixel˚u. Ve tˇrech rozmˇerech má obecnˇe kaˇzdý bin m´ısto dvou dvacet ˇsest soused˚u (neplat´ı pro krajn´ı biny histogramu); dále je tˇreba si uvˇedomit, ˇze zat´ımco mezn´ı biny H komponenty spolu soused´ı, pro S a V sloˇzku toto neplat´ı. Nav´ıc je tˇreba zavést následuj´ıc´ı podm´ınku - pokud je hodnota S pˇr´ıliˇs malá (pˇribliˇznˇe 0.1), porovnávaj´ı se pouze sousedn´ı biny ve smˇeru V sloˇzky. Kdyˇz jsou hodnoty S pˇr´ıliˇs malé, lidské oko nedokáˇze rozeznat zmˇenu barvy pˇri zmˇenˇe hodnoty V.

(26)

(a) (b) Obr. 11 Hill-Climbing algoritmus

Jedin´ymi parametry tohoto algoritmu je poˇcet jednotliv´ych bin˚u histogramu.

Pravidlem je, ˇze H sloˇzka je kvantizována do v´ıce úrovn´ı neˇz zbylé dvˇe sloˇzky tak, aby reflektovala r˚uznorodost barev. Doporuˇcený pomˇeru bin˚u H:S:V je 16:8:8[15], pˇri tomto rozloˇzen´ı ovˇsem docház´ı u vˇetˇs´ıch obrazu k ˇcásteˇcnému pˇresegmentován´ı a zvolen byl proto nakonec pomˇer 15:7:7.

Pro kaˇzdý bin histogramu je prozkoumáno vˇsech jeho 26 soused˚u a kaˇzdý pixel obrazu mus´ı být pˇriˇrazen k jednomu z lokáln´ıch maxim v histogramu (tzn.

k segmentu). Pˇri poˇctu bin˚u N_i a celkov´em poˇctu pixel˚u N_p je tedy ˇcasov´a sloˇzitost Hill-climbing segmentaceO(26N_i+N_p).

3.3 Prvn´ı dˇ elen´ı na z´ akladˇ e velikosti

Jak je patrné z Obr.12(b) (segmenty znázornˇené odst´ıny ˇsedi), segmentace pomoc´ı Hill-Climbing algoritmu vytváˇr´ı velmi zrnité oblasti na hranic´ıch jednot- livých objekt˚u v obraze. Jedná se o malé segmenty o velikosti ˇrádovˇe nˇekolika des´ıtek aˇz nˇekolika stovek pixel˚u (výjimkou ovˇsem nejsou ani nˇekolikapixelové segmenty). Z hlediska pragmatiˇcnosti nejsou tyto segmenty nijak d˚uleˇzité a je tedy moˇzno je pˇr´ımo oddˇelit od dostateˇcnˇe velikých segment˚u. Toto je vy- konáno obyˇcejným prahován´ım - nejdˇr´ıve je vypoˇctena jejich velikost (tj. poˇcet pixel˚u) a pokud je menˇs´ı neˇz stanovený práh, segment je ”zahozen”. Práh byl urˇcen na 0.4% celkového poˇctu pixel˚u v obraze, coˇz je pˇri alokaci 250000 pixel˚u na obraz pˇribliˇzne 1000 pixel˚u. Pouˇzit´ım takového prahován´ı doˇslo u Obr.12 k odstranˇen´ı ˇctyˇriceti dvou segment˚u (odstranˇené ˇcásti jsou znázornˇeny fialo- vou barvou na Obr.12(c)).

Pˇri celkovém poˇctu pixel˚uN_p a celkovém poˇctu segment˚uk je ˇcasová sloˇzitost oddˇelen´ı malých segment˚uO(N_p+k) - ke spoˇc´ıtán´ı velikosti staˇc´ı jednou proj´ıt výstup z Hill-Climbing algoritmu (odtud O(N_p)) a poté je kaˇzdý poˇcet po- rovnán s prahem (odtud O(k)).

(27)

(a) P˚uvodn´ı obr´azek

(b) Segmentace (c) Odstranˇen´ı mal´ych segment˚u Obr. 12 Prvn´ı dˇelen´ı na z´akladˇe velikosti

3.4 Prostorov´ e oddˇ elen´ı segment˚ u a druh´ e dˇ elen´ı na z´ akladˇ e velikosti

Segmentace pomoc´ı Algoritmu zdoláván´ı kopc˚u nebere v úvahu prostorové rozloˇzen´ı segment˚u, viz jednoduchý pˇr´ıklad na Obr.13 (segmentace na Obr.13(b) opˇet znázornˇena odst´ıny ˇsedi; v tomto pˇr´ıpadˇe pouze ˇcernou a b´ılou barvou, jelikoˇz existuj´ı pouze dva segmenty p˚uvodn´ıho obrazu - oranˇzová a modrá ˇ

c´ast).

(a) P˚uvodn´ı obr´azek (b) Segmentace Obr. 13 Prostorovˇe neoddˇelen´e segmenty

(28)

Vstupem algoritmu je pole s rozˇrazen´ım pixel˚u do segment˚u (po odstranˇen´ı malých segment˚u); výstupem je seznam index˚u patˇr´ıc´ıch segmentu (pro kaˇzdý segment jeden seznam). K prostorovému oddˇelen´ı je pouˇz´ıváno okol´ı (pro potˇreby tohoto textu nazvané1 4 okol´ı) pixelu (bodu) z Obr.14 - o pˇredstavuje zpracovávaný pixel (bod), x zkoumané okol´ı.

x x x

x o

Obr. 14 Okol´ı pixelu (o) pouˇzit´e pˇri prostorov´em dˇelen´ı

Pro kaˇzdý segment vypadá pseudokód algoritmu pro prostorové oddˇelen´ı následovnˇe 0. Inicializace algoritmu:

index:= 1

rastr := matice o rozmˇerech p˚uvodn´ıho obrázku, defaultn´ı hodnota 0 belong:= prázdné pole

1. Pro∀pixelp zpracovávaného segmentu (p je na pozici(i,j) v p˚uvodn´ım obrázku): neigh := nenulové hodnoty 1 4 okol´ıbodu rastr(i,j)

(a) Je-li neigh pr´azdn´e, potom:

• rastr(i, j) :=index

• belong.add(index)

• index:=index+ 1

(b) Nen´ı-li neigh pr´azdn´e, potom:

• id_min := minim´aln´ı hodnota neigh

• rastr(i, j) :=id_min

• pro ∀i∈neigh: belong(i) = id_min

2. Vytvoˇren´ı prázdného seznamu pro kaˇzdý prostorovˇe samostatný segment, celkový poˇcet je tˇechto seznam˚u je maximáln´ı hodnota polebelong 3. Pro ∀l, m taková, ˇze rastr(l, m) 6= 0 je do z-tého seznamu pˇridán index odpov´ıdaj´ıc´ı pozici (l,m); z je hodnota pole belong na pozici dané indexem rastr(l,m)

Popsaný algoritmus je vysvˇetlen na následuj´ıc´ım pˇr´ıkladu. Je uvaˇzován obrázek o rozmˇerech 6x2 a po Hill-Climbing segmentaci zauj´ımá jeden ze segment˚u indexy na pozic´ıch [2,4,6,7,8,10,11], viz. Obr.15 - nalevo jsou kˇr´ıˇzky vyznaˇceny body patˇr´ıc´ı segmentu, napravo je znázornˇena indexace jednotlivých pixel˚u.

(29)

x x

x x x x x

0 1 2 3 4 5

6 7 8 9 10 11

Obr. 15 Pˇr´ıklad oddˇelovan´eho segmentu

Inicializace algoritmu (krok 0) pouze vytvoˇr´ı prázdnou nulovou matici rastr o rozmˇerech 2 ˇrádky a 6 sloupc˚u, vytvoˇr´ı prázdné pole belong a do promˇenné index pˇriˇrad´ı hodnotu 1.

Prvn´ı pixel segmentu je na pozici 2, 1 4 okol´ı tohoto bodu v rastr neobsahuje ˇzádnou nenulovou hodnotu, a tak se pokraˇcuje podle kroku 1.(a) - do rastr(0,2) je pˇriˇrazena hodnota 1, do pole belong je pˇridána jedniˇcka (prozat´ım jednoprvkové pole) a hodnota promˇennéindex je navýˇsena na 2.

Dalˇs´ı zpracovávaný bod je na pozici 4 a opˇet jsou v jeho1 4 okol´ısamé nuly. Na rastr(0,4) je pˇriˇrazena hodnota 2, belong je dvojprvkové pole s s hodnotami 1 a 2 a index je zvˇetˇsen na 3.

Pˇr´ıliˇs se toho nezmˇen´ı ani pˇri zpracov´an´ı dalˇs´ıho bodu (pozice 6) - belong je nyn´ı tˇr´ıprvkov´e pole [1,2,3] a rastr je na Obr.16

0 0 1 0 2 0

3 0 0 0 0 0

Obr. 16 Hodnoty maticerastr po tˇrech kroc´ıch algoritmu

Prvn´ım ”zaj´ımavým”pixelem je bod na pozici 7, v jeho 1 4 okol´ı jsou 1 a 3 (mimo dvou nul, které jsou ovˇsem ignorovány). Postupuje se podle kroku 1.(b), do id_min je pˇriˇrazena menˇs´ı z hodnot, tedy 1; na rastr(1,1) je pˇriˇrazena tatáˇz hodnota a dojde i k úpravˇe pole belong, jeˇz nyn´ı vypadá následovnˇe: [1,2,1]

(Pozn.: je moˇzné si vˇsimnout malé nesrovnalosti v indexac´ıch, zat´ımco matice rastr a vˇsechna prozat´ım zmiˇnovaná pole zaˇc´ınaj´ı indexem 0, polebelongzaˇc´ıná indexem 1. Tato indexace, aˇc moˇzná matouc´ı, je zámˇerná.)

Hodnoty rastr po dokonˇcen´ı 1. kroku algoritmu jsou ve Obr.17; polebelong se jiˇz nezmˇenilo - [1,2,1]. Význam tohoto pole spoˇc´ıvá v pˇriˇrazen´ı r˚uzných hodnot matice rastr prostorovˇe souvislému shluku. Hodnota 1 na tˇret´ım indexu pole belong znamená, ˇze indexy vrastr s hodnotou 3 patˇr´ı do stejného shluku jako indexy s hodnotou 1; na druhou stranu indexy s hodnotou 2 tvoˇr´ı samostatný shluk.

0 0 1 0 2 0

3 1 1 0 2 2

Obr. 17 Koneˇcn´e hodnoty matice rastr

(30)

Následnˇe jsou podle 2. kroku vytvoˇreny dva prázdné seznamy a podle 3.

kroku jsou do nich pˇridˇelovány indexy. Výsledkem jsou tedy segmenty popsané indexy [2,6,7,8] a [4,10,11].

Neˇzádouc´ım vedlejˇs´ım produktem prostorového oddˇelován´ı je moˇznost tvorby pˇr´ıliˇs malých segment˚u. To se m˚uˇze stát v pˇr´ıpadˇe, ˇze segment projde prvn´ım testem na minimáln´ı velikost a následnˇe je v tomto kroku rozdˇelen na dvˇe ˇ

ci v´ıce ˇcást´ı, které by t´ım samým testem jiˇz neproˇsly. Proto je tˇreba znovu otestovat velikosti a malé segmenty odstranit - opˇet je nastavena hranice 0.4%

celkového poˇctu pixel˚u (pˇri alokaci 250000 pixel˚u na obraz pˇribliˇznˇe 1000 pixel˚u). Zároveˇn jsou odstranˇeny (pˇresnˇeji vzato jsou uloˇzeny ”bokem”, protoˇze je tˇechto segment˚u potˇreba v urˇcitých situac´ıch, viz. dále) pˇr´ıliˇs velké segmenty, které mohou být povaˇzovány za patˇr´ıc´ı pozad´ı. V prvn´ım dˇelen´ı podle velikosti nemohlo k tomuto úkonu doj´ıt, nebot’ nebylo moˇzné rozeznat pˇr´ıliˇs velké celistvé segmenty od pˇr´ıliˇs velkých necelistvých segment˚u, tj. takových, které maj´ı po prostorovém oddˇelen´ı pˇrijatelnou velikost. Práh maximáln´ı velikosti byl urˇcen na 15% celkového poˇctu pixel˚u v obraze, coˇz dˇelá pˇribliˇznˇe 37500 pixel˚u pˇri nastavené alokaci.

Algoritmus pro kaˇzdý segment vytvoˇr´ı jednu matici o velikosti p˚uvodn´ıho obrázku - prvky matice jsou v 1. kroku sekvenˇcnˇe procházeny, je kontrolováno jejich 1 4 okol´ı a upravována jejich hodnota. Zjiˇstˇen´ı 1 4 okol´ı nen´ı závislé na celkovém poˇctu pixel˚u ani na poˇctu segment˚u a lze tedy z´ıskat v konstantn´ım ˇcase. K úpravˇe pole belong docház´ı (i kdyˇz zpravidla tomu tak nen´ı) v kaˇzdé iteraci 1. kroku algoritmu, tj. pro kaˇzdý prvek matice - jsou mˇenˇeny maximálnˇe ˇctyˇri jeho hodnoty (tolik je maximum nenulových hodnot v 1 4 okol´ıkaˇzdého bodu). Pˇri velikosti tohoto pole N_m, celkovém poˇctu pixel˚uN_p a poˇctu zpracovávaných segment˚ukje tedy ˇcasová sloˇzitost 1. kroku algoritmu O(4kN_mN_p).

2. krok algoritmu je oˇcividnˇe ˇcasovˇe konstantn´ı, docház´ı v nˇem pouze ke stanoven´ı poˇctu oddˇelených segment˚u. Ve 3. kroku algoritmu docház´ı k opˇetovnému sekvenˇcn´ımu procházen´ı (a opˇet pro kaˇzdý zpracovaný segment) a k pˇriˇrazován´ı index˚u jednotlivým segment˚um. ˇCasová sloˇzitost 3. kroku je tedyO(kN_p).

Celková ˇcasová sloˇzitost prostorového oddˇelen´ı je O(kN_p(4N_m+ 1)), kde k N_p a N_m N_p. k je zpravidla v ˇrádech jednotek aˇz nˇekolika málo des´ıtek;

N_m je zpravidla také v ˇrádech jednotek aˇz nˇekolika málo des´ıtek a je závislé na ˇclenitosti hranic segment˚u.

Sloˇzitost odstranˇen´ı segment˚u neˇzádouc´ıch velikost´ı je rovna O(k) - kaˇzdý segment má sv˚uj vlastn´ı seznam, staˇc´ı tedy pouze zkontrolovat velikost kaˇzdého seznamu a porovnat s nastavenými prahy.

(31)

3.5 Krit´ erium pro vyb´ır´ an´ı segment˚ u

C´ılem algoritmu popsaného na zaˇcátku této kapitoly je vybrat z libovolného vstupn´ıho obrázku ˇcásti tak, aby tyto ˇcásti odpov´ıdaly objekt˚um v obraze.

Toho se dosáhne výˇse popsaným segmentaˇcn´ım algoritmem. Vybrané ˇcásti by dále mˇely být vizuálnˇe pˇrijatelné, a i kdyˇz se jedná o vcelku vágn´ı a hlavnˇe do- sti subjektivnˇe zaloˇzený poˇzadavek, existuj´ı deskriptory geometrických tvar˚u (shape descriptors), podle kterých je moˇzné rozhodnout.

Zvaˇzovány byly následné deskriptory zaloˇzené na oblasti popisovaného geome- trického tvaru (region-based shape descriptors[5])

• Eccentricity udává pomˇer délky hlavn´ı osy (major axis) a ve- dlejˇs´ı osy (minor axis)

• Elongatedness udává podobnost tvaru pˇr´ımce a spoˇc´ıtá se jako pomˇer ˇs´ıˇrky a výˇsky nejmenˇs´ıho obklopuj´ıc´ıho obdéln´ıku (minimum area enclosing rectangle) daného tvaru

• Rectangularity mˇeˇr´ı podobnost obdéln´ıku a je vypoˇctena jako pomˇer obsahu daného tvaru ku souˇcinu rozmˇer˚u nejmenˇs´ıho obklopuj´ıc´ıho obdéln´ıku

• Compactness vyjadˇruje podobnost geometrick´eho tvaru a kruˇznice

Elongatedness nelze snadno (pomoc´ı nejmenˇs´ıho obklopuj´ıc´ıho obdéln´ıku) vy- poˇc´ıtat pro v´ıce zakˇrivené tvary, coˇz z n´ı dˇelá nevhodného kandidáta pro po- pis ”dobrých“ tvar˚u. Podobnost obdéln´ıku (rectangularity) ˇci ”zploˇstˇen´ı”tvaru (eccentricity) byly také zam´ıtnuty jako vlastnosti, které nepopisuj´ı vhodnost tvaru. Vybrána byla tedy kompaktnost; podobnost kruˇznici (kruhu) se totiˇz jevila jako vizuálnˇe uspokojivá.

3.5.1 V´ ypoˇ cet kompaktnosti geometrick´ eho tvaru

Kompaktnost geometrického tvaru (také nˇekdy nazývána shape index) je nu- merická kvantita vyjadˇruj´ıc´ı kompaktnost tvaru (a nebo jako bylo zm´ınˇeno dˇr´ıve, podobnost tvaru a kruˇznice). Kompaktnost je uznávána jako jedna z nejzaj´ımavˇejˇs´ıch a nejd˚uleˇzitˇejˇs´ıch vlastnost´ı geometrického tvaru a je hojnˇe pouˇz´ıvána nejen v odvˇetv´ı poˇc´ıtaˇcového vidˇen´ı[17]. Mezi pˇr´ıklady pouˇzit´ı patˇr´ı definován´ı a analýza homogenn´ıch oblast´ı výskytu v ekologii, object matching

(32)

a rozpoznáván´ı vzor˚u (pattern recognition) v oblasti umˇelé inteligence, po- pis a vyhledáván´ı objekt˚u v obrazových databáz´ıch[17]. V psychologických studi´ıch byla kompaktnost zavedena jako ukazatel stability a estetiˇcnosti geo- metrického tvaru[18], coˇz jen umocˇnuje jej´ı výbˇer pro selekci ”dobrých”tvar˚u.

Snahy o vyj´adˇren´ı kompaktnosti geometrick´eho tvaru maj´ı dlouho historii([17]).

V roce 1822 navrhl Ritter vyjádˇren´ı kompaktonosti jako pomˇer obvodu P ku ploˇse tvaru A. I kdyˇz je takové vyjádˇren´ı pˇr´ımoˇcaré, tento jednoduchý pomˇer se zmˇen´ı pˇri zmˇenˇe velikosti tvaru. Tuto veliˇcinu je moˇzné uˇcinit bezrozmˇernou, pokud se vypoˇcte pomˇer plochy ku druhé mocninˇe obvodu; mezi mnohé varianty tohoto postupu patˇr´ı napˇr´ıklad pomˇer 4A/P² (Miller, 1953) ˇci 2√

πA/P (Richardson, 1961). Nejpouˇz´ıvanˇejˇs´ım vyj´adˇren´ım kompaktnosti tohoto typu je potom IPQ index (Osserman, 1978) dan´y pˇredpisem

C_{IP Q} = 4πA P²

HodnotyC_{IP Q}náleˇz´ı intervalu (0,1i. Geometrické tvary s vyˇsˇs´ı hodnotouC_{IP Q} jsou kompaktnˇejˇs´ı neˇz tvary s niˇzˇs´ı hodnotou C_{IP Q}, nejkompkatnˇejˇs´ı je kruh s C_{IP Q} rovným jedné.

Dalˇs´ım zp˚usobem ˇc´ıselného vyjádˇren´ı kompaktnosti je porovnáván´ı s refe- renˇcn´ımi tvary. Cole v roce 1964 navrhl porovnáván´ı plochy A zkoumaného tvaru s plochou nejmenˇs´ı opsané kruˇznice tomuto tvaru A_SC jako alternativu ke Gibbsovˇe (1961) pomˇeru 4A/L², kde Lje vzdálenost dvou nejvzdálenˇejˇs´ıch bod˚u na obvodu tvaru. V roce 1984 zavedli Kim a Anderson toto porovnán´ı jako index DCM (digital compactness measure)

C_DCM = A ASC

Stejnˇe jako uC_{IP Q} náleˇz´ı hodnotyC_DCM intervalu (0,1i, kdy nejkompaktnˇejˇs´ı kruh nabývá opˇet hodnoty jedna.C_DCM nen´ı bohuˇzel moˇzné pouˇz´ıt na nevy- plnˇené geometrické tvary (tj. tvary s otvory) a nav´ıc nen´ı invariantn´ı v˚uˇci zmˇenˇe velikosti.

Bottema v roce 2000 navrhl dalˇs´ı veliˇcinu vyuˇz´ıvaj´ıc´ı referenˇcn´ıch tvar˚u CBottema = 1− |A∩A₀|

A₀

která vyuˇz´ıvá kruhu stejné plochy jako mˇeˇrený geometrický objekt, konkrétnˇe velikosti pr˚uniku tohoto kruhu a mˇeˇreného geometrického objektu (Aje povrch

(33)

objektu, A₀ povrch kruhu). Dalˇs´ı index podobn´y C_Bottema pˇredstavil v roce 2000 Wentz. Jeho podoba je (pˇri stejn´e notaci jako uC_Bottema)

El = |A∩A₀|

|A∪A₀|

C_BottemaiEl lze pouˇz´ıt na objekty s otvory; nevýhodou je vˇsak potˇreba nalezen´ı optimáln´ıho (tj. maximáln´ıho) pˇrekryt´ı mˇeˇreného objektu a zkonstruovaného kruhu a nav´ıc opˇet nen´ı ani jeden index invariantn´ı v˚uˇci zmˇenˇe velikosti.

Bribiesca v roce 1997 navrhl index NDC (normalized discrete compactness) pˇr´ımo pro rastrov´a data

C_{N DC} =

4n−p

2 −n+ 1 n−2√

n+ 1

kde p je poˇcet (mezn´ıch) hran mˇeˇreného geometrického tvaru a n celkový poˇcet pixel˚u tohoto tvaru.C_{N DC} je invariantn´ı v˚uˇci zmˇenˇe velikosti a reflektuje nevyplˇnenost objekt˚u, je vˇsak potˇreba urˇcit poˇcet hran p mˇeˇreného objektu.

Z výˇse popsaných veliˇcin na mˇeˇren´ı kompaktnosti geometrického objektu byl vybrán index C_{IP Q}. Nejen, ˇze lze relativnˇe snadno vypoˇc´ıtat, nemá ˇzádné zásadn´ı nevýhody (dokáˇze si poradit s d´ırovanými objekty a je invariantn´ı v˚uˇci zmˇenˇe velikosti).

3.5.2 V´ ypoˇ cet IP Q indexu

Pro pˇripomenut´ı, pˇredpis pro výpoˇcet CIP Q indexu dvojrozmˇerného geomet- rického obrazce pˇri známém obvodu P (z anglického perimeter) a pˇri známém obsahu A (area) je

C_{IP Q} = 4πA P²

Hodnota A se pro jednotlivé segmenty snadno z´ıská jako poˇcet prvk˚u v seznamu index˚u reprezentuj´ıc´ıho daný segment, který byl z´ıskán pˇri prostorovém oddˇelován´ı (posledn´ı provádˇený úkol); trochu problematiˇctˇejˇs´ı je to s urˇcen´ım obvodu P.

K výpoˇctu obvodu geometrického obrazce je nejprve potˇreba zjistit hranici objektu, k ˇcemuˇz byl pouˇzit Freeman˚uv ˇretˇezový kód (Freeman’s chain code nebo jen Freeman’s code)[19]. Tento kód slouˇz´ı k popisu hranic objekt˚u a vyuˇz´ıvá k tomu oznaˇcen´ı okoln´ıch pixel˚u zkoumaného pixelu ˇc´ısly viz Obr.18. Pro úˇcely této práce byla pouˇzita 8-kontektivita (z Freemanova ˇretˇezového kódu také vznikl název1 4 okol´ı pouˇz´ıvaný v kapitole o oddˇelován´ı segment˚u).

(34)

(a) 4-konektivita (b) 8-konektivita Obr. 18 Freeman˚uv ˇretˇezov´y k´od

Od poˇcáteˇcn´ıho pixelu, který je prvn´ım a zároveˇn i posledn´ım prvkem ˇretˇezového kódu, je sekvenc´ı (ˇretˇezem) takovýchto ˇc´ısel popsána hranice objektu zpravidla ve smˇeru hodinových ruˇciˇcek. Napˇr´ıklad ˇretˇezový kód [0,1,2,7,0,6,5,7,1,0,0,1]

popisuje ˇc´ast hranice na Obr.19[20].

Obr. 19 Pˇr´ıklad popisu hranice objektu

Algoritmus pro nalezen´ı kódu[21] zaˇc´ıná v jednom z extrémn´ıch pixel˚u, tzn.

v jednom z pixel˚u leˇz´ıc´ıch nejv´ıce vlevo, nejv´ıce vpravo, nejv´ıce dole nebo nejv´ıce nahoˇre. Jelikoˇz prvn´ı pixel v seznamu kaˇzdého segmentu je z podstaty algoritmu na prostorové oddˇelen´ı zároveˇn pixelem leˇz´ıc´ım nejv´ıce nahoˇre, je zvolen právˇe tento pixel. Dalˇs´ı pixely segmentu mohou sice leˇzet ve stejné výˇsce (a to pouze napravo od prvn´ıho pixelu seznamu), pro zjiˇstˇen´ı ˇretˇezového kódu to ovˇsem nen´ı ˇzádnou pˇrekáˇzkou. Ze zvoleného poˇcáteˇcn´ıho bodu m˚uˇze ˇretˇez pokraˇcovat pouze ve smˇerech 0, 7, 6 a 5; smˇery 1, 2 a 3 jsou vylouˇceny, jelikoˇz ˇzádný pixel nem˚uˇze leˇzet nad startovn´ı pozic´ı a smˇer 4 je vylouˇcen na

(35)

základˇe argumentu z pˇredchoz´ı vˇety, tj. startovn´ı pozice nem˚uˇze z principu m´ıt souseda vlevo. Je tˇreba dodrˇzovat i poˇrad´ı prohledávaných sousedn´ıch smˇer˚u - ze startovn´ıho pixelu je tˇreba nejprve prozkoumat pixel ve smˇeru 0 a teprve pokud tento pixel nenáleˇz´ı segmentu, pokraˇcuje se ve smˇeru 7 (a následnˇe 6 a 5, je-li to nutné). Po nalezen´ı správného pixelu z hranice segmentu se stejným zp˚usobem pokraˇcuje v z´ıskáván´ı dalˇs´ıch ˇcást´ı kódu, dokud se algoritmus nevrát´ı opˇet na zaˇcátek. V kaˇzdém kroku jsou ovˇsem prozkoumávány jiné smˇery (tzn. 0, 7, 6, 5 nejsou univerzáln´ı posloupnost´ı kandidát˚u); prvn´ı takovýto smˇer je o dva v´ıce neˇz posledn´ı pˇridaný, napˇr´ıklad je-li posledn´ım prvkem ˇretˇezového kódu 4, prvn´ım kandidátem je smˇer 6 a v pˇr´ıpadˇe jeho nevybrán´ı se pokraˇcuje dále ve smˇeru hodinových ruˇciˇcek (tj. 5, 4, 3 atd.).

Popsaný algoritmus je vysvˇetlen na následuj´ıc´ım pˇr´ıkladu. Je uvaˇzován obrázek o rozmˇerech 4x4 a segment popsaný indexy [1,2,4,5,6,8,9,10,11,13,14], viz.

Obr.20 - nalevo jsou kˇr´ıˇzky vyznaˇceny body patˇr´ıc´ı segmentu, napravo je zn´azornˇena indexace jednotliv´ych pixel˚u.

x x

x x x

x x x x

x x x

0 1 2 3

4 5 6 7

8 9 10 11

12 13 14 15

Obr. 20 Pˇr´ıklad segmentu

Zaˇc´ıná se bodem, který má index 1, a postupnˇe jsou prohledávány smˇery 0, 7, 6 a 5. Pˇresnˇeji ˇreˇceno by tyto smˇery byly prozkoumávány, jiˇz smˇer 0 ovˇsem náleˇz´ı segmentu, je tedy pˇridán do ˇretˇezového kódu a algoritmus pokraˇcuje.

Prvn´ım kandidátem na dalˇs´ı postup je smˇer o dva vˇetˇs´ı neˇz posledn´ı pˇridaný, tj. 2. Pixel v tomto smˇeru ovˇsem nenáleˇz´ı segmentu (neleˇz´ı ani v obrázku samotném) a tak je prozkoumána následuj´ıc´ı moˇznost po smˇeru hodinových ruˇciˇcek (tj. 1), která je vˇsak také zam´ıtnuta. Postupnˇe jsou zavrhnuty i smˇery 0 a 7. Bod ve smˇeru 6 je jiˇz souˇcást´ı segmentu, a tak je pˇridán do ˇretˇezového kódu, který má nyn´ı tvar 0-6. Algoritmus pokraˇcuje podle stejného principu dále (dalˇs´ı krok zvaˇzuje nejdˇr´ıve smˇer 0), dokud se obrys objektu neuzavˇre.

Výsledný ˇretˇezový kód má podobu 0-6-7-6-4-4-3-2-1.

Po zjiˇstˇen´ı obrysu (reprezentován ˇretˇezovým kódem) je jiˇz moˇzno vypoˇc´ıtat (pˇresnˇeji vzato odhadnout) hodnotu obvoduP, viz. [20]. Prvn´ı moˇznost´ı je jed- noduché poˇc´ıtán´ı pixel˚u, a i kdyˇz se jedná o velmi pˇr´ımoˇcarou moˇznost, docház´ı k podhodnocen´ı výsledného obvodu; diagonáln´ı kroky (lichá ˇc´ısla v ˇretˇezovém kódu) maj´ı totiˇz ve skuteˇcnosti vˇetˇs´ı délku neˇz uvaˇzovaných 1. Freeman navrhl pro kaˇzdý takový diagonáln´ı krok pˇriˇc´ıtat√

2 nam´ısto 1, viz. [19], coˇz reflektuje skuteˇcnou vzdálenost stˇred˚u pixel˚u. Problém reálných objekt˚u a jejich obrys˚u

(36)

spoˇc´ıvá v digitalizaci dat. Je-li souˇcást´ı hranice rovná pˇr´ımka (ve smyslu kol- mosti k hranic´ım obrázku), vˇse funguje tak jak má. Je-li ovˇsem ta samá pˇr´ımka m´ırnˇe natoˇcena (napˇr. o nˇekolik málo stupˇn˚u), dojde pˇreveden´ım na obraz sloˇzený z pixel˚u k jej´ımu ”zazubatˇen´ı”a souˇcet vzdálenost´ı stˇred˚u pixel˚u tedy neodpov´ıdá jej´ı skuteˇcné délce. Proffitt a Rosen[22] toto reflektovali a odhad upravili na P = 0.948e+ 1.340o, kdee je poˇcet sudých ˇc´ısel v ˇretˇezovém kódu ao je poˇcet lichých ˇc´ısel v ˇretˇezovém kódu. Vossepoel a Smeulders[23] výpoˇcet dále zpˇresnili na P = 0.948e+ 1.340o−0.091c, kde e ao maj´ı stejný význam jako v pˇredchoz´ım vzorci a c udává kolikrát ˇretˇezový kód zmˇenil hodnotu (corner count).

Luengo provedl experiment[20], kdy postupnˇe natáˇcel obdéln´ık a pro kaˇzdé natoˇcen´ı mˇeˇril kaˇzdou z metod jeho obvod. Výsledky jsou znázornˇeny na Obr.55 - na oseyje hodnota odhadnutého obvodu, na osex natoˇcen´ı obdéln´ıku, modˇre jsou hodnoty pro poˇc´ıtán´ı pixel˚u ˇretˇezového kódu, zelenˇe Freemanovo zlepˇsen´ı, ˇcervenˇe metoda od Proffitta a Rosena, tyrkysovˇe metoda od Vos- sepoela a Smeulderse a ˇcárkovanˇe je na ose y skuteˇcná hodnota obvodu. Je vidˇet, ˇze poˇc´ıtán´ı pixel˚u podhodnocuje obvod u jakéhokoli natoˇcen´ı a také, ˇze metoda od Vossepoela a Smeulderse se s natoˇcen´ım vypoˇrádá opravdu nejlépe z pˇredstavených metod.

Obr. 21 Porovn´an´ı metod na mˇeˇren´ı obvodu

Vypoˇcten´ıIP Qindexu jednoho segmentu je pˇri poˇctu pixel˚u v tomto segmentu N_s roven O(N_s). Obsah segmentu A lze z´ıskat konstantˇe, je roven velikosti seznamu reprezentuj´ıc´ıho segment. Obvod segmentu P je z´ıskán v ˇcaseO(N_s) - pˇri poˇc´ıtán´ı ˇretˇezového kódu jsou prozkoumány pixely hranice (maximálnˇe N_s) a u kaˇzdého je v konstantn´ım ˇcase urˇcen smˇer postupu (8 moˇzných smˇer˚u nezávislých na poˇctu pixel˚u).

(37)

3.6 Operace ovlivˇ nuj´ıc´ı IP Q index

Jak je patrné z Obr.12, segmenty jsou u svých hranic velmi ˇclenité a obsahuj´ı pomˇernˇe velké mnoˇzstv´ı r˚uznˇe velikých otvor˚u. Pˇred samotným výbˇerem ˇ

zádouc´ıch segment˚u s dostateˇcným IP Qindexem jsou proto tyto vizuáln´ı nedostatky odstranˇeny pomoc´ı dvou operac´ı, které IP Q index mˇen´ı (zvˇetˇsuj´ı).

Tyto operace jsou vysvˇetleny v n´asleduj´ıc´ıch dvou podkapitol´ach.

3.6.1 Matematick´ a morfologie

Prvn´ı z pouˇzitých metod na vizuáln´ı zlepˇsen´ı segmentu se op´ırá o binárn´ı mate- matickou morfologii[5] (tj. morfologii binárn´ıch obraz˚u), matematický nástroj pouˇz´ıvaj´ıc´ı nelineárn´ı operátory operuj´ıc´ı na tvaru objektu. Jelikoˇz se jedná o pomˇernˇe sloˇzitou problematiku, bude zde diskutována hlavnˇe s d˚urazem na praktické pouˇzit´ı.

Morfologická analýza vyuˇz´ıvá moˇznosti zápisu binárn´ıch obraz˚u jako podmnoˇzin dvojrozmˇerného prostoru celých ˇc´ısel Z². Napˇr´ıklad segment (coˇz je vlastnˇe binárn´ı obraz - pixely segmentu patˇr´ı obrazu, tj. maj´ı hodnotu 1 a zbývaj´ıc´ı pixely obrazu nepatˇr´ı, jejich hodnota je 0) na Obr.22,

× ×

Obr. 22 Pˇr´ıklad segmentu jako bin´arn´ıho obrazu

kde × pˇredstavuj´ı pixely patˇr´ıc´ı segmentu a je poˇcátek souˇradnicové sou- stavy, tj. má souˇradnice (0,0), lze vyjádˇrit jako mnoˇzinu

X ={(1,0),(2,0),(0,1),(1,1),(1,2),(2,2)}

Morfologická transformace je vyjádˇrena relac´ı mnoˇzinovˇe zapsaného binárn´ıho obrazu a strukturn´ıho elementu - malé mnoˇziny vztaˇzené k lokáln´ımu poˇcátku, která slouˇz´ı jako ”lokáln´ı sonda”v morfologických operac´ıch. Nejˇcastˇeji pouˇz´ıvané strukturn´ı elementy jsou ve Obr.23

(38)

× × ×

×

× × ×

×

× × ×

×

Obr. 23 Nejˇcastˇeji pouˇz´ıvan´e strukturn´ı elementy

Prvn´ım z pomocných úkon˚u pouˇz´ıvaných v binárn´ı morfologii je translace X_h mnoˇziny X o radiusvektor h daná vztahem.

X_h ={p∈ E² :p=x+h pro∀x∈X}

kde E² oznaˇcuje 2D euklidovsk´y prostor. Pˇr´ıklad je na Obr.24

× ×

× × × ×

×

× ×

X h X_h

Obr. 24 Posunut´ı o radiusvektor

Druhou pomocnou operac´ı je transpozice ˘B mnoˇziny B (nˇekdy oznaˇcov´ano jako stˇredov´a symetrie)

B˘ ={−b: ∀b ∈B} Pˇr´ıklad transpozice je na Obr.25

× ×

B B˘

Obr. 25 Transpozice

Binárn´ı matematická morfologie vyuˇz´ıvá dvou základn´ıch operac´ı, které jsou neinvertovatelné, dilatace a eroze. Binárn´ı dilatace ⊕lze vyjádˇrit jako

X⊕B ={p∈ E² :p=x+b, x ∈X, b ∈B}

(39)

nebo pomoc´ı Minkowsk´eho souˇctu jako sjednocen´ı posunut´ych mnoˇzin X⊕B = [

b∈B

X_b

Pˇr´ıklad bin´arn´ı dilatace je na Obr.26

× ×

× × × ×

× ×

× × ×

× × × × × ×

X B X⊕B

Obr. 26 Bin´arn´ı dilatace

Binárn´ı erozi je také moˇzné zapsat dvˇema zp˚usoby. Bud’ se kontroluje, zda vˇsechna moˇzná posunut´ıx+b leˇz´ı v p˚uvodn´ı mnoˇzinˇeX a pokud ano, náleˇz´ı bod x také výsledku (tj. erodované mnoˇzinˇe)

X B ={p∈ E² :p=x+b∈X pro∀b ∈B}

a nebo je eroze urˇcena jako Minkowsk´eho rozd´ıl (pr˚unik vˇsech posunut´ı mnoˇziny X o kaˇzd´y vektor −b)

X B = \

b∈B

X−b

Pˇr´ıklad bin´arn´ı eroze je na Obr.27

×

× × ×

×

× × ×

×

X B X B

Obr. 27 Bin´arn´ı eroze

Na kaˇzd´y segment je pouˇzita bin´arn´ı dilatace (se strukturn´ım elementem z Obr.28), ˇ

c´ımˇz dojde k zaplnˇen´ı drobných dˇer a úzkých záliv˚u. Zároveˇn vˇsak dojde k ”na- kynut´ı”objektu a z toho d˚uvodu je následnˇe pouˇzita binárn´ı eroze (s totoˇzným

(40)

strukturn´ım elementem). Takovéto posloupnosti operac´ıX•B = (X⊕B) B se ˇr´ıká binárn´ı uzavˇren´ı•. Výsledkem je segment s menˇs´ım (nebo v pˇripadˇe

”pˇekn´ych“ objekt˚u stejn´ym) obvodem a vˇetˇs´ım (nebo opˇet v pˇr´ıpadˇe

”pˇekn´ych“

objekt˚u stejn´ym) obsahem neˇz segment p˚uvodn´ı.

× × ×

Obr. 28 Pouˇzit´y strukturn´ı element B

Urˇcen´ı ˇcasové sloˇzitosti záleˇz´ı na datové struktuˇre, zat´ım vágnˇe oznaˇcované jako seznam, ve které je segment uchován. V kaˇzdém pˇr´ıpadˇe je tˇreba provést 8 posunut´ı segmentu a tato posunut´ı pro dilataci sjednotit a pro erozi po dvojic´ıch proniknout.

3.6.2 Zaplˇ nov´ an´ı velk´ ych dˇ er

Aplikace matematické morfologie, konkrétnˇe binárn´ıho uzavˇren´ı, se vypoˇrádá mimo ˇclenitosti hranic i s malými otvory v objektech, v tˇech ovˇsem mohou i nadále z˚ustat otvory vˇetˇs´ıho charakteru.

Indexy se liˇs´ı o 1

ano

ne

Pokraˇcuje se dalˇs´ı dvojic´ı

Oba indexy patˇr´ı

hranici

ano

ne Do segmentu

jsou pˇrid´any chybˇej´ıc´ı indexy

Obr. 29 Vývojový diagram vyplˇnován´ı segment˚u

(41)

Vývojový diagram algoritmu pro jejich vyplnˇen´ı je na Obr.29 Sekvenˇcnˇe je procházen seˇrazený seznam s indexy segmentu a po dvojic´ıch jsou kontrolovány sousedn´ı indexy. Liˇs´ı-li se tyto indexy pouze o jedna, nen´ı zde ˇzádný prostor pro jakýkoli otvor a pokraˇcuje se tedy dalˇs´ı dvojic´ı. Pixely hranice segmentu leˇz´ı v seznamu na sousedn´ıch pozic´ıch a liˇsit se mohou i o v´ıce neˇz jedna, v tomto pˇr´ıpadˇe se ovˇsem také o otvor v objektu nejedná a je tedy opˇet moˇzno pˇrej´ıt na dalˇs´ı dvojici. K vyplnˇen´ı dojde pouze tehdy, jsou-li sousedn´ı indexy rozd´ılné o v´ıce neˇz jeden a alespoˇn jeden z nich neleˇz´ı na hranici objektu, tj.

leˇz´ı nˇekde uvnitˇr. V tomto pˇr´ıpadˇe je tˇreba po jedn´e doplnit vˇsechny dalˇs´ı indexy v rozmez´ı t´eto dvojice.

Pro algoritmus je tedy nutné zjistit indexy leˇz´ıc´ı na hranici segmentu. K tomu se vyuˇzije ˇretˇezový kód reprezentuj´ıc´ı hranici, který je spoˇc´ıtán v tˇechto m´ıstech a dále se pouˇzije i pro výpoˇcetIP Qindexu, jelikoˇz vyplnˇen´ı mezer v objektech nijak nezmˇen´ı hranici objektu. Jak bylo ˇreˇceno dˇr´ıve, prvn´ı index v seznamu kaˇzdého segmentu je také poˇcáteˇcn´ım pixelem pro výpoˇcet ˇretˇezového kódu.

Toho se vyuˇzije pˇri zjiˇst’ován´ı hraniˇcn´ıch index˚u, které je moˇzno odvodit z ta- bulky ve Obr.30 (w je ˇs´ıˇrka obrázku v pixelech)

hodnota

ˇretˇezov´eho k´odu 0 1 2 3 4 5 6 7

zmˇena indexu +1 -(w-1) -w -(w+1) -1 +w-1 +w +w+1

Obr. 30 Zmˇena indexu v závislosti na hodnotˇe ˇretˇezového kódu

Dále je tˇreba poˇc´ıtat s nepˇr´ıliˇs ˇcastou eventualitou, kdy jeden segment m˚uˇze být uvnitˇr druhého. V tomto pˇr´ıpadˇe je vyplnˇen´ı otvoru patˇr´ıc´ımu menˇs´ımu segmentu ve vˇetˇs´ım segmentu neˇzádouc´ı. K zjiˇst’ován´ı takovéto situace jsou pouˇzity pozice mezn´ıch pixel˚u kaˇzdého objektu, tj. pozice nejv´ıce vlevo, pozice nejv´ıce vpravo, pozice nejv´ıce dole a pozice nejv´ıce nahoˇre, podle kterých se dá snadno zjisti zda je segment potenciálnˇe uvnitˇr jiného ˇci nikoli. Nav´ıc z´ıskán´ı tˇechto mezn´ıch pozic nic nestoj´ı, je moˇzno je zjistit jako vedlejˇs´ı pro- dukt binárn´ıho uzavˇren´ı, pˇri kterém jsou procházeny vˇsechny indexy kaˇzdého segmentu.

Algoritmus zkoum´a kaˇzdou sousedn´ı dvojici v seˇrazen´em seznamu a v pˇr´ıpadˇe, kdy se jejich hodnota liˇs´ı o v´ıce neˇz jedna zjiˇst’uje, zda jsou oba pixely hraniˇcn´ı.

Seznam s hraniˇcn´ımi pixely o velikosti N_b nemus´ı být seˇrazen, a tak je tˇreba ho sekvenˇcnˇe proj´ıt; ˇcasová sloˇzitost tohoto úkonu je tedy O(N_b). Pˇridáván´ı chybˇej´ıc´ıch pixel˚u je pˇri poˇctu tˇechto pixel˚uN_miss moˇzné v ˇcaseO(N_miss). Pˇri celkovém poˇctu pixel˚u segmentu N_s se tedy ˇcasová sloˇzitost m˚uˇze vyˇsplhat na O(N_missN_bN_s +N_s), nebot’ je tˇreba jeˇstˇe vypoˇc´ıtat Freeman˚uv ˇretˇezový kód segmentu (sloˇzitost diskutována dˇr´ıve). Nav´ıc vˇetˇsinou plat´ı, ˇzeN_b N_s

(42)

a N_miss N_s. Zpravidla je ovˇsem poˇcet vyplˇnovaných ˇcást´ı v ˇrádu jednotek a algoritmus se tak velmi bl´ıˇz´ı sloˇzitosti O(N_s).

Zjiˇstˇen´ı, zda jeden segment leˇz´ı uvnitˇr jiného, je pˇri celkovém poˇctu segment˚u k moˇzný v ˇcase O(k(k+ 1)/2) - je potˇreba porovnat ˇctyˇri mezn´ı hodnoty kaˇzdé dvojice. Samotné odstranˇen´ı pixel˚u menˇs´ıho segmentu z vˇetˇs´ıho je ˇ

casovˇe nároˇcné, pˇri velikosti malého segmentuN_small a velkého segmentu N_big je ˇcasová sloˇzitost O(N_smallN_big) - pro kaˇzdý pixel menˇs´ıho objektu je tˇreba zjistit, zda tento náleˇz´ı ve vˇetˇs´ım. Naˇstˇest´ı k tomuto jevu docház´ı velmi zˇr´ıdka.

3.6.3 V´ ysledky operac´ı

Výsledky obou výˇse popsaných operac´ı jsou znázornˇeny na pˇr´ıkladu Obr.31.

Na Obr.31(a) je podoba p˚uvodn´ıho segmentu, na prvn´ı pohled je patrné velké mnoˇzstv´ı r˚uznˇe velikých dˇer a také ˇclenitost jeho hranice viz. Obr.31(b). Apli- kace binárn´ıho uzavˇren´ı odstran´ı velké mnoˇzstv´ı dˇer a zároveˇn i vyhlad´ı hranice, viz. Obr.31(c) a Obr.31(d). Stále je vˇsak patrná pˇr´ıtomnost otvor˚u, jeˇz jsou odstranˇeny algoritmem k tomu urˇceným Obr.31(e).

3.7 Vyb´ır´ an´ı segment˚ u podle IP Q indexu

Po úpravˇe segment˚u z pˇredchoz´ı kapitoly je nyn´ı moˇzné vybrat výsledné segmenty. Výbˇer prob´ıhá ve tˇrech fáz´ıch:

1. Prahován´ı s n´ızkým prahem a zohlednˇen´ım pozice segmentu v obraze 2. Dˇelen´ı velkých, tj. pˇr´ıliˇs vysokých ˇci pˇr´ıliˇs ˇsirokých, segment˚u

3. Prahov´an´ı s vyˇsˇs´ım prahem a bez zohlednˇen´ı pozice segmentu v obraze

3.7.1 V´ ybˇ er kompaktn´ıch segment˚ u - 1. pr˚ uchod

V prvn´ı fázi je zohlednˇena pozice segmentu, konkrétnˇe je kontrolováno zda segment neleˇz´ı v pˇr´ıliˇsné bl´ızkosti hranic obrázku a pokud ano, je umˇele sn´ıˇzen jeho IP Q index. Tento úkon vycház´ı z myˇslenky, ˇze

”nehezké“ (tj. nepˇr´ıliˇs kompaktn´ı) objekty jsou vizuálnˇe pˇrijatelnˇejˇs´ı, pokud leˇz´ı uprostˇred obrázku.

K urˇcen´ı vzdálenosti od hranice je pouˇzito tˇeˇziˇstˇe segmentu CoG (center of gravity), které je vypoˇcteno následovnˇe

(43)

(a) P˚uvodn´ı segment (b) Hranice p˚uvodn´ıho segmentu

(c) Segment po aplikaci bin´arn´ıho uzavˇren´ı

(d) Hranice segmentu po aplikaci bin´arn´ıho uzavˇren´ı

(e) Segment po vyplnˇen´ı dˇer Obr. 31Zlepˇsov´an´ı vlastnost´ı segmentu.

(44)

CoG= (x₀, y₀)

x₀ = PA

i=1

$s(i) w

%

A y₀ =

PA

i=1(s(i) mod w) A

kdesje seznam s indexy segmentu,Aje plocha segmentu (poˇcet prvk˚us) awje ˇs´ıˇrka obr´azku.

IP Q index je pˇren´asoben konstantou k, viz. Obr.32 k=







d^0.3 pro objekty v bl´ızkosti hranic

1 jinak

kde d je relativn´ı vzdálenost tˇeˇziˇstˇe objektu od hranice obrázku k hodnotˇe mez z Obr.32, konkrétnˇe minimum vzdálenost´ıy₀ od levého a pravého okraje a minimum vzdálenost´ıx₀ od horn´ıho ˇci doln´ıho okraje. Hodnota mez je 20%

celkové ˇs´ıˇrky, respektive 15% celkové výˇsky

Obr. 32 Uprava´ IP Qindexu v bl´ızkosti hranic obr´azku.

k je poˇc´ıtáno zvláˇst’ pro vzdálenost od levého a pravého okraje a zvláˇst’ pro vzdálenost od horn´ıho a spodn´ıho okraje. IP Q index je potom pˇrenásoben menˇs´ı z obou hodnot, jelikoˇz pˇrenásoben´ı obˇema by velmi znevýhodˇnovalo objekty v roz´ıch obrázku.