• Nebyly nalezeny žádné výsledky

Graf vykreslený po zvolení možnosti Plot Discarded Data . Čer-

inteval. Červená čiara znázorňuje lineárny fit.

Tools > Expected Value of Constant Parameter > Plot Discarded Data. Použitie 3σ kritéria je veľmi jednoduchý a pomerne robustný spôsob, ako zís-kať konštantnú podmnožinu výberu. Napríklad pri analýze dát z merania váhy re-gulačnej tyče metódou Rod-Drop alebo Source-Jerk môže byť v niektorých prípa-doch zložité rozhodnúť o tom či „hraničný bod“ prislúcha skôr ustálenému stavu alebo skôr napríklad pádu absorpčnej tyče. Jedným zo spôsobov ako v podob-ných prípadoch rozhodnúť je práve 3σ kritérium. Pri použití nástroja Expected Value of Constant Parameter stačí nadhodnotiť vybraný interval (zahrnúť aj malú časť pádu) a algoritmus iteratívne nájde odhad „hraničného bodu“. Príklad tejto techniky je znázornený na obrázku 5.2.

Overenie normality

Jedným zo základných predpokladov je, že sa užitočný interval riadi nor-málnym rozdelením. Na normalite súboru je založená celá klasická analýza dát.

V prípade priamych meraní sa zvyčajne normalita predpokladá bez ďalšieho ove-renia. V prípade meraní v jadrových aplikáciách vychádza predpoklad normality z aproximácie Poissonovho rozdelenia normálny tak, ako to bolo popísané v pod-kapitole 2.2. Niektoré testy normality sú popísané v literatúre (Meloun a Militký, 2004).

V algoritme nástroja Expected Value of Constant Parameter sú použité tri testy normality: Lillieforsov test, Andersonov-Darlingov test, Jarqueov-Beraov test. V

Tools > Expected Value of Constant Parameter > Normality Test Logic.

je možné zvoliť logiku vyhodnocovania normality z uvedených troch testov. Pred-volená je logika 2/3, čo znamená, že daný súbor sa považuje za pochádzajúci z normálneho rozdelenia, keď to potvrdia aspoň dva z uvedených troch testov.

V prípade, že súbor nesplní kritérium normality na základe zvolenej logiky, je

zo súboru odstránená jedna krajná hodnota a proces sa opakuje. S odstraňova-ním krajnej hodnoty súvisí možnosť voľby:

Tools > Expected Value of Constant Parameter > Interval Selection Mode,

ktorá je spoločná pre overenie normality, nezávislosti a nulovej smernice. Význam voľby módu výberu intervalu bude diskutovaný v závere tejto podkapitoly.

Všetky tri uvedené testy normality sú priamo implementované v programe Matlab pod príkazmi:

lillietest(X) adtest(X) jbtest(X)

kdeX je vstupný vektor dát. Každý z testov rozhodne o nulovej hypotéze že dáta vo vektore X pochádzajú z normálneho rozdelenia oproti alternatívnej hypotéze, že z tohto rozdelenia nepochádzajú na 5% úrovni významnosti.

Lillieforsov test je založený na Kolmogorovovm-Smirnovovom teste popísanom v článku (Massey, 1951). Lillieforsov test a Jarqueov-Beraov test je dvojstranný test zhody modelu s pozorovaním1. Andersonov-Darlingov test je založený na roz-dieli medzi empirickou a hypotetickou kumulatívnou distribučnou funkciou. Pod-robný popis týchto testov je uvedený v článkoch (Lilliefors, 1964) resp. (Jarque a Bera, 1987) resp. (Anderson a Darling, 1952).

Pre zhrnutie problematiky testov normality je vhodný napríklad článok (Gha-semi a Zahediasl, 2012). Porovnanie diskutovaných troch a aj ďalších vybraných testov normality je prehľadne zhrnuté napríklad v článku (Yap a Sim, 2011). Po-rovnanie bolo vykonané na 50 000 výberoch z rôznych rozdelení o 15 rôznych rozsahoch pri 5% a 10% úrovni významnosti. Miera sily testu bola stanovená ako relatívny počet prípadov, v ktorých test zamietol hypotézu normality príslušného rozdelenia. V tomto článku bolo dokopy testovaných 24 rozdelení pravdepodob-nosti rozdelených do troch skupín: „symetrické s krátkymi koncami“, „symetrické s dlhými koncami“ a „asymetrické rozdelenia“. Výsledkom štúdie je, že v sku-pine „symetrické s dlhými koncami“ je dobre použiteľný Jarqueov-Beraov test a v skupine „asymetrické rozdelenia“ je dobre použiteľný Andersonov-Darlingov test. Rozdiely medzi jednotlivými testami sú najvýraznejšie pre malé rozsahy súborov, ktoré sú v tomto prípade ošetrené minimálnou veľkosťou.

V prípade, že sa dáta z užitočného intervalu na základe zvolenej logiky riadia normálnym rozdelením, v informačnom paneli sa objavia informácie o výsledku každého z troch testov. V prípade, že veľkosť užitočného intervalu pri iteratív-nom odstraňovaní krajných bodov klesne pod minimálnu hodnotu, algoritmus sa ukončí a v informačnom paneli sa objaví hláška o nedostatočnej veľkosti súboru.

Porovnanie histogramu užitočného intervalu a normálneho rozdelenia môže experimentátor nadobudnúť pri využití možnosti vykreslenia fitovaného histo-gramu:

Tools > Expected Value of Constant Parameter > Plot Histogram.

1angl.: two-sided goodness-of-fit test

Overenie nezávislosti prvkov

Ďalším základným predpokladom je nezávislosť prvkov štatistického súboru.

Podľa (Meloun a Militký, 2004) je závislosť prvkov obvykle spôsobená tromi fak-tormi:

• nestabilitou meracieho zariadenia alebo zmenou stavu meracieho zariadenia,

• nekonštantnosťou podmienok merania,

• zanedbaním faktorov, ktoré výrazne ovplyvňujú výsledok merania ako na-príklad objem vzoriek, tlak, teplota, chemická čistota atď.

Pri experimentoch na reaktore VR-1 je asi najčastejším faktorom spôsobujúcim závislosť prvkov nekonštantnosť podmienok merania. Príkladom môže byť snaha nadobudnúť ustálený stav v reaktore a zaznamenávať odozvu neutrónového detek-tora, pričom v skutočnosti bude dochádzať k osciláciám okolo ustáleného stavu vplyvom oscilácie regulačnej tyče. Snahou pri overovaní nezávislosti je takéto tendencie vo vstupných dátach odhaliť a pokiaľ možno vyvarovať sa skresleniu výsledkov vplyvom závislosti. Uvedené faktory sa môžu meniť skokovo, alebo ply-nule s časom. Pri skokovej zmene je odhalenie závislosti prvkov pomerne jednodu-ché, pretože vo vstupných dátach vzniká nehomogenita, pri odhaľovaní ktorej sú dostatočne efektívne aj zvyšné nástroje používané pri overovaní základných pred-pokladov. Pokiaľ sa uvedené faktory menia s časom, dochádza k časovej závislosti prvkov.

K identifikácii časovej závislosti prvkov sa podľa (Meloun a Militký, 2004) testuje významnosť autokorelačného koeficientu prvého ráduρ1. Korelačný koefi-cient rádu k je definovaný ako (Hyndman a Athanasopoulos, 2018):

ρk=

∑︁N

i=k+1(xix¯)(xi−1x¯)

∑︁N

i=1(xix¯)2 . (5.1) Autokorelačný koeficient je mierou lineárneho vzťahu medzi posunutými prvkami v časovom rade. Pokiaľ xi sú namerané hodnoty, ρk je mierou vzťahu medzi xi a xi−k.

V literatúre (Meloun a Militký, 2004) je použité testovacie kritérium založené na Neumannovom pomere, pričom autor spomína aj existenciu ďalších testov.

Aj napriek snahe implementovať toto kritérium sa zdá, že kritérium bolo príliš prísne, pretože prakticky žiadne vstupné dáta týmto kritériom neboli považované za nezávislé. Z toho dôvodu bol v algoritme použitý Ljungov-Boxov Q-test. Tento test spoločne testuje autokoreláciu vo viacerých posuvoch. Vychádza z Boxovej-Pierceovej Q štatistiky, podrobne popísanej v (Box a Pierce, 1970) a samotný test je podrobne popísaný v (Ljung a Box, 1978). Tento test bol vybraný nakoľko je priamo implementovaný v programe Matlab pod príkazom:

lbqtest(res) kde res je vstupný vektor reziduí.

Po spustení nástroja Expected Value of Constant Parameter algoritmus použije Ljungov-Boxov Q-test na užitočný interval dát, podobne ako to bolo v prípade testov normality. V prípade, že súbor nesplní kritérium nezávislosti, je zo súboru odstránená jedna krajná hodnota a proces sa opakuje. S odstraňovaním krajnej hodnoty súvisí možnosť voľby:

Tools > Expected Value of Constant Parameter > Interval Selection Mode,

ktorá je spoločná pre overenie normality, nezávislosti a nulovej smernice. Význam voľby módu výberu intervalu bude diskutovaný v závere tejto podkapitoly.

Pre ilustráciu autokorelácie je možné vykresliť autocorrelogram možnosťou:

Tools > Expected Value of Constant Parameter > Plot Autocorrelogram.

Autocorrelogram, tiež nazývaný correlogram, je graf autokorelačnej funkcie. Au-tokorelačná funkcia (ACF) je závislosť autokorelačného koeficientu ráduk od po-sunuk:ρk(k). Z definície autokorelačnej funkcie vyplýva, že je definovaná iba pre celé, nezáporné čísla a ACF(0) = 1. V prípade nezávislých meraní autokorelačná funkcia rýchlo skonverguje k nule bez zjavného trendu.

Význam autocorrelogramu pre experimentátora môže byť ilustrovaný na na-sledujúcom príklade. Predpokladajme, že výsledkom merania výkonu reaktora v ustálenom stave sú dva priebehy odozvy detektora vykreslené na obrázku 5.3.

V oboch prípadoch sa priebeh javí ako ustálený a až autokorelačná funkcia po-môže odhaliť opak. Odozva v oboch priebehoch je vytvorená ako súčet gaussov-ského šumu a signálu. Signál v priebehu 1 je konštantný a v priebehu 2 sínusový.

Na obrázku 5.4 je vidno, že pre konštantný signál autokorelačná funkcia prak-ticky ihneď klesá k nule bez zjavného trendu. Pre sínusový signál autokorelačná funkcia periodicky prekračuje konfidenčné intervaly (o veľkosti dvoch štandard-ných odchýlok) a má zjavný trend.

Tento príklad ilustroval situáciu, ktorá môže pri experimentoch na reaktore nastať. Aj keď odozva detektora nikdy nie je iba gaussovský šum, tomuto prípadu sa blíži priebeh 3 na obrázku 5.5. Priebeh 3 je nameraná odozva neutrónového detektora po spracovaní nástrojom Expected Value of Constant Parameter (užitočný interval). Prípadu sínusového signálu sa blíži priebeh 4 na obrázku 5.5. Tento signál vznikol tak, že reaktor bol najskôr uvedený do kritického stavu a v okolí tohto stavu operátor osciloval pomocou automatického riadenia výkonu reaktora (AUTO). V prípade priebehu 4 by jednoducho mohlo dôjsť k použitiu nesprávneho predpokladu o nezávislosti dát. Z priebehov autokorelačných fun-kcií na obrázku 5.6 je jasne vidieť, že priebeh 3 je veľmi podobný priebehu 1 na obrázku 5.4 a priebeh 4 je naopak veľmi podobný priebehu 2 na rovnakých obrázkoch. Experimentátor by mal v tomto prípade rozhodnúť o vylúčení prie-behu 4 z ďalšieho spracovania.

Overenie nulovosti smernice

Ako bolo spomenuté v úvode tejto podkapitoly, okrem overenia štyroch pred-pokladov vychádzajúcich z literatúry (Meloun a Militký, 2004) je algoritmom na vstupné dáta kladená ešte dodatočná piata požiadavka týkajúca sa ich lineár-neho trendu. Keďže nástroj Expected Value of Constant Parameter slúži na zistenie hodnoty ustálenej veličiny, je prirodzené požadovať, aby sa dáta v pr-vom priblížení javili ako konštantné. Do určitej miery je tento predpoklad re-prezentovaný požiadavkou normality a neprítomnosti vybočujúcich meraní, no aj v literatúre (Meloun a Militký, 2004) je odporúčané použiť pri spracovaní jedno-rozmerných dát aj iné metódy, ako napríklad rôzne diagnostické grafy. Navyše,

0 50 100 150 200 250 300 0.96

0.98 1 1.02 1.04

Odozva detektora

104 Priebeh 1

0 50 100 150 200 250 300

0.96 0.98 1 1.02 1.04

Odozva detektora

104 Priebeh 2

Obr. 5.3: Teoretické priebehy odozvy detektora.

0 0.5 1

ACF

Priebeh 1

0 10 20 30 40 50 60 70 80 90 100

Posuvy

-0.5 0 0.5 1

ACF

Priebeh 2

0 10 20 30 40 50 60 70 80 90 100

Posuvy