• Nebyly nalezeny žádné výsledky

Úvod do teorie odhadu

N/A
N/A
Protected

Academic year: 2022

Podíl "Úvod do teorie odhadu"

Copied!
18
0
0

Načítání.... (zobrazit plný text nyní)

Fulltext

(1)

Úvod do teorie odhadu

Cvičení 9.

(2)

Jak odhadnout parametry populace?

 Bodový odhad - parametr základního souboru aproximujeme jediným číslem (př.

Výběrový průměr -> odhad střední hodnoty)

 Intervalový odhad – parametr populace aproximujeme intervalem, v němž s velkou pravděpodobností příslušný populační parametr leží. (př. Střední hodnota leží v intervalu < 𝑎; 𝑏 > s pravděpodobností 1 − 𝛼)

(3)

Co je co v terminologii intervalových odhadů?

𝑃 𝑇𝐷 ≤ 𝜃 ≤ 𝑇𝐻 = 1 − 𝛼

hledaný parametr (konstanta, kterou nejsme

schopni přesně určit)

meze intervalu spolehlivosti (náhodné veličiny)

spolehlivost odhadu, tj. pravděpodobnost s níž hledaný parametr 𝜃 leží v intervalu 𝑇𝐷; 𝑇𝐻

(4)

Intervalový odhad jako důsledek výběrových charakteristik

 Uvažujme náhodný výběr z normálního rozdělení s parametry: velikost 𝑛, výběrový průměr 𝑋, směrodatná odchylka 𝜎

 Z výběrových charakteristik víme, že charakteristika 𝑋−𝜇

𝜎 𝑛 má normované normální rozdělení 𝑁(0; 1)

 Zvolíme si pravděpodobnost, s kterou chceme zachytit danou charakteristiku:

1 − 𝛼

 Pak například: 𝑃 𝑋−𝜇

𝜎 𝑛 < 𝑧1−𝛼 = 1 − 𝛼, kde 𝑧1−𝛼 je kvantil normovaného normálního rozdělení

 Úpravou nerovnosti uvnitř pravděpodobnosti získáme 𝑃 𝜇 > 𝑋 − 𝑧1−𝛼

𝑛 𝜎 = 1 − 𝛼

 Získali jsme levostranný interval spolehlivosti pro odhadovanou střední hodnotu

 𝑋 − 𝑧1−𝛼

𝑛 𝜎 se nazývá mezí (vše jsou známé hodnoty, tedy umíme napočítat číselnou hodnotu)

(5)

Jaké jsou typy intervalů spolehlivosti?

 oboustranné

𝑃 𝜃 < 𝑇𝐷 = 𝑃 𝜃 > 𝑇𝐻 = 𝛼 2

Tyto dvě podmínky zaručují, že 𝑃 𝑇𝐷 ≤ 𝜃 ≤ 𝑇𝐻 = 1 − 𝛼.

 jednostranné (odhadujeme-li například délku života nějakého zařízení, je pro nás důležitá pouze dolní mez)

 levostranné: 𝑃 𝜃 ≥ 𝑇𝐷 = 1 − 𝛼

 pravostranné : 𝑃 𝜃 ≤ 𝑇𝐻 = 1 − 𝛼

(6)

Co to znamená, že spolehlivost odhadu je 1-𝛼?

92 97 102 107

1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97

od had

realizace

Simulace intervalových odhadů střední hodnoty (spolehlivost 0,95) získaných na základě opakovaných výběrů o rozsahu 30 z populace se střední hodnotou 100.

6 intervalů ze 100 neobsahuje skutečnou střední hodnou.

(7)

Vybrané intervalové odhady

parametrů rozdělení náhodné veličiny

(8)

Intervalový odhad střední hodnoty

náhodné veličiny s normálním rozdělením

a) známe-li rozptyl 𝜎2

Předpokládejme, že sledovaná náhodná veličina X má normální rozdělení s neznámou střední hodnotou 𝜇 a známým rozptylem 𝜎2. Vyberme vzorek z dané populace. Nechť má tento výběrový soubor rozsah 𝑛 𝑛 < 0,05𝑁 a průměr 𝑥.

kde 𝑧𝑝 jsou 𝑝-kvantily 𝑁(0; 1)

Intervalový odhad střední hodnoty 𝜇 se spolehlivostí 1 − 𝛼 při známém rozptylu 𝜎2

Oboustranný 𝑥 − 𝜎

𝑛𝑧1−𝛼

2; 𝑥 + 𝜎

𝑛𝑧1−𝛼

2

Levostranný 𝑥 − 𝜎

𝑛𝑧1−𝛼

Pravostranný 𝑥 + 𝜎

𝑛𝑧1−𝛼

(9)

Intervalový odhad střední hodnoty

náhodné veličiny s normálním rozdělením

b) neznáme-li rozptyl 𝜎2

Předpokládejme, že sledovaná náhodná veličina X má normální rozdělení s neznámou střední hodnotou 𝜇 a neznámým rozptylem 𝜎2. Vyberme vzorek z dané populace. Nechť má tento výběrový soubor rozsah 𝑛 𝑛 < 0,05𝑁 , průměr 𝑥 a výběrovou směrodatnou odchylku 𝑠.

kde 𝑡𝑝 jsou 𝑝-kvantily Studentova rozdělení 𝑠 𝑛 − 1 stupni volnosti

Intervalový odhad střední hodnoty 𝜇 se spolehlivostí 1 − 𝛼 při neznámém rozptylu 𝜎2

Oboustranný 𝑥 − 𝑠

𝑛𝑡1−𝛼

2; 𝑥 + 𝑠

𝑛𝑡1−𝛼

2

Levostranný 𝑥 − 𝑠

𝑛𝑡1−𝛼

Pravostranný 𝑥 + 𝑠

𝑛𝑡1−𝛼

(10)

Intervalový odhad střední hodnoty - obecně

V obecném případě, kdy neznáme typ rozdělení, používáme tzv. robustní

(neparametrické) postupy. Robustní postupy hodnocení náhodné veličiny typicky používáme v případech, kdy

 výběrový soubor obsahuje odlehlá pozorování, která nemohou být opravena a není vhodné je vyloučit,

 výběrový soubor nepochází z normálního rozdělení,

 výběrový soubor má velké rozptýlení dat.

Výklad robustních přístupů není součástí základního kurzu statistiky. Zájemci najdou základní informace v kapitole 4.4 (Úvod do statistiky).

(11)

Intervalový odhad rozptylu (sm. odchylky) norm. rozdělení

Předpokládejme, že sledovaná náhodná veličina X má normální rozdělení s neznámou střední hodnotou 𝜇 a neznámým rozptylem 𝜎2. Vyberme vzorek z dané populace. Nechť má tento výběrový soubor rozsah 𝑛 𝑛 < 0,05𝑁 a výběrovou směr. odchylku 𝑠.

Intervalový odhad rozptylu 𝜎2se spolehlivostí 1 − 𝛼 při neznámé střední hodnotě 𝜇

Oboustranný 𝑛−1 𝑠

2

𝜒1−𝛼 2

; 𝑛−1 𝑠2

𝜒𝛼 2

Levostranný 𝑛−1 𝑆2

𝜒1−𝛼

Pravostranný 𝑛−1 𝑠2

𝜒𝛼

kde 𝜒𝑝 jsou 𝑝-kvantilyChí − kvadrát rozdělení 𝑠 𝑛 − 1 stupni volnosti

(12)

Intervalový odhad parametru binom. rozdělení (máme-li k dispozici dostatečně velký výběr)

Intervalový odhad relativní četnosti 𝜋 se spolehlivostí 1 − 𝛼 𝑛 > 30,𝑛

𝑁 < 0,05, 𝑛 > 9 𝑝 1 − 𝑝

Oboustranný 𝑝 −𝑧1−𝛼

2

𝑝 1−𝑝

𝑛 ; 𝑝 +𝑧1−𝛼

2

𝑝 1−𝑝 𝑛

Levostranný 𝑝 −𝑧1−𝛼 𝑝 1−𝑝

𝑛

Pravostranný 𝑝 +𝑧1−𝛼 𝑝 1−𝑝

𝑛

kde 𝑧𝑝 jsou 𝑝-kvantilynormovaného normálního rozdělení standardní

(Waldův) odhad

(13)

Odhad rozsahu výběru

v případě, že odhadujeme střední hodnotu nebo parametr binom. rozdělení

Odhad rozsahu výběru potřebného pro

nalezení interval. odhadu se spolehlivostí 1 − 𝛼 a maximální přípustnou chybou ∆𝑚𝑎𝑥

Odhadovaný populační parametr Požadovaný

rozsah výběru

Střední hodnota 𝜇 (známe 𝜎) 𝑛 ≥ 𝜎

𝑚𝑎𝑥𝑧1−𝛼

2 2

Střední hodnota 𝜇 (neznáme 𝜎) 𝑛 ≥ 𝑠1

𝑚𝑎𝑥𝑡1−𝛼 2

2

Parametr binom. rozdělení 𝜋

𝑛 ≥ 𝑧1−𝛼

2

2𝑝1 1 − 𝑝1

𝑚𝑎𝑥2 𝑛 ≥ 𝑧1−𝛼

2

2 1 4∆𝑚𝑎𝑥2

(14)

Intervalový odhad poměru rozptylů

dvou náhodných veličin s normálním rozdělením

Intervalový odhad poměru rozptylů 𝜎12

𝜎22 se spolehlivostí 1 − 𝛼

Oboustranný 𝑓1

1−𝛼 2

𝑆12 𝑆22; 1

𝑓𝛼 2

𝑆12 𝑆22

Levostranný 1

𝑓1−𝛼 𝑆12 𝑆22

Pravostranný 1

𝑓𝛼 𝑆12 𝑆22

kde 𝑓𝑝 jsou 𝑝-kvantilyFisherova − Snedecorova rozdělení

𝑠 𝑛1− 1 stupni volnosti v čitateli a 𝑛2− 1 stupni volnosti ve jmenovateli

(15)

Intervalový odhad rozdílů středních hodnot

dvou náhodných veličin s normálním rozdělením

a) známe rozptyly 𝝈𝟏𝟐 a 𝝈𝟐𝟐 obou populací

Mějme dvě populace s normálním rozdělením, jejichž rozptyly 𝜎12 a 𝜎22 známe. Z těchto populací jsme provedli dva nezávislé náhodné výběry o rozsahu 𝑛1 a 𝑛2 (𝑛1 <

Intervalový odhad rozdílu středních hodnot 𝜇1 − 𝜇2 se spolehlivostí 1 − 𝛼 (známe 𝜎1, 𝜎2)

Oboustranný 𝑥1 − 𝑥2 − 𝑧1−𝛼

2

𝜎12 𝑛1 +𝜎22

𝑛2; 𝑥1 − 𝑥2 + 𝑧1−𝛼

2

𝜎12 𝑛1 +𝜎22

𝑛2

Levostranný 𝑥1 − 𝑥2 − 𝑧1−𝛼 𝜎12

𝑛1 +𝜎22

𝑛2

Pravostranný 𝑥1 − 𝑥2 + 𝑧1−𝛼 𝜎12

𝑛1 +𝜎22

𝑛2

kde 𝑧𝑝 jsou 𝑝-kvantilynormovaného normálního rozdělení

(16)

Intervalový odhad rozdílů středních hodnot

dvou náhodných veličin s normálním rozdělením

b) neznáme jejich rozptyly 𝝈𝟏𝟐 a 𝝈𝟐𝟐, ale víme, že 𝝈𝟏𝟐 = 𝝈𝟐𝟐

Mějme dvě populace s normálním rozdělením, jejichž rozptyly neznáme, ale víme, že jsou shodné. Z těchto populací jsme provedli dva nezávislé náhodné výběry o rozsahu 𝑛1 a 𝑛2 𝑛1 < 0,05𝑁, 𝑛2 < 0,05𝑁 , a určili jejich průměry 𝑥1 a 𝑥2 a výběrové směrodatné odchylky 𝑠1 a 𝑠2.

Intervalový odhad rozdílu středních hodnot 𝜇1 − 𝜇2 se spolehlivostí 1 − 𝛼 (neznáme 𝜎12, 𝜎22, ale víme, že 𝜎12 = 𝜎22)

Oboustranný 𝑥1𝑥2 − 𝑡1−𝛼

2

𝑛1−1 𝑠12+ 𝑛2−1 𝑠22 𝑛1+𝑛2−2

1 𝑛1+𝑛1

2; 𝑥1𝑥2 + 𝑡1−𝛼

2

𝑛1−1 𝑠12+ 𝑛2−1 𝑠22 𝑛1+𝑛2−2

1 𝑛1+𝑛1

2

Levostranný 𝑥1𝑥2 − 𝑡1−𝛼 𝑛1−1 𝑠𝑛 12+ 𝑛2−1 𝑠22

1+𝑛2−2 1 𝑛1+𝑛1

2

Pravostranný 𝑥1𝑥2 + 𝑡1−𝛼 𝑛1−1 𝑠𝑛 12+ 𝑛2−1 𝑠22

1+𝑛2−2 1 𝑛1+𝑛1

2

kde 𝑡𝑝 jsou 𝑝-kvantilyStudentova rozdělení s 𝑛1+ 𝑛2− 2 stupni volnosti

(17)

Intervalový odhad rozdílů středních hodnot

dvou náhodných veličin s normálním rozdělením

c) neznáme jejich rozptyly 𝝈𝟏𝟐 a 𝝈𝟐𝟐, a nelze předpokládat, že 𝝈𝟏𝟐 = 𝝈𝟐𝟐

Mějme dvě populace s normálním rozdělením, jejichž rozptyly neznáme a nelze

předpokládat, že jsou shodné. Z těchto populací jsme provedli dva nezávislé náhodné výběry o rozsahu 𝑛1 a 𝑛2 𝑛1 < 0,05𝑁, 𝑛2 < 0,05𝑁 , a určili jejich průměry 𝑥1 a 𝑥2 a výběrové směrodatné odchylky 𝑠1 a 𝑠2.

Intervalový odhad rozdílu středních hodnot 𝜇1 − 𝜇2 se spolehlivostí 1 − 𝛼 (neznáme 𝜎12, 𝜎22, a nelze předpokládat, že 𝜎12 = 𝜎22)

Oboustranný 𝑥1− 𝑥2 − 𝑡1−𝛼

2

𝑠12 𝑛1+𝑠22

𝑛2; 𝑥1− 𝑥2 + 𝑡1−𝛼

2

𝑠12 𝑛1+𝑠22

𝑛2

Levostranný 𝑥1− 𝑥2 − 𝑡1−𝛼 𝑠12

𝑛1+ 𝑠22

𝑛2

Pravostranný 𝑥1− 𝑥2 + 𝑡1−𝛼 𝑠12

𝑛1+𝑆22

𝑛2

kde 𝑡𝑝 jsou 𝑝-kvantilyStudentova rozdělení s

𝑆12 𝑛1+𝑆2

2 𝑛2

2

𝑆12 𝑛1

2 1

𝑛1+1+ 𝑆2 2 𝑛2

2 1

𝑛2+1

− 2 stupni volnosti

(18)

Intervalový odhad pro rozdíl parametrů binom. rozdělení dvou náhodných veličin

Mějme dvě populace. Z těchto populací jsme provedli dva nezávislé náhodné výběry o rozsahu 𝑛1 a 𝑛2 𝑛1 < 0,05𝑁, 𝑛2 < 0,05𝑁 . Výběr z první populace obsahoval 𝑥1 prvků se sledovanou

vlastností, výběr z druhé populace obsahoval 𝑥2 prvků se sledovanou vlastností. Výběrové relativní četnosti 𝑝1, 𝑝2 jsme pak určili dle vztahů 𝑝1 = 𝑥1

𝑛1, 𝑝2 = 𝑥2

𝑛2.

Intervalový odhad rozdílu relativních četností 𝜋1− 𝜋2 se spolehlivostí 1 − 𝛼

∀𝑖 ∈ 1,2 : 𝑛𝑖 > 30,𝑛𝑖

𝑁𝑖 < 0,05, 𝑛𝑖 > 9 𝑝𝑖 1 − 𝑝𝑖 Oboustranný 𝑝1− 𝑝2 − 𝑧1−𝛼

2 𝑝 1 − 𝑝 𝑛1

1 +𝑛1

2 ; 𝑝1− 𝑝2 + 𝑧1−𝛼

2 𝑝 1 − 𝑝 𝑛1

1+𝑛1

2

Levostranný 𝑝1− 𝑝2 − 𝑧1−𝛼 𝑝 1 − 𝑝 1

𝑛1+ 1

𝑛2

Pravostranný 𝑝1− 𝑝2 + 𝑧1−𝛼 𝑝 1 − 𝑝 1

𝑛1+ 1

𝑛2

kde 𝑧𝑝 jsou 𝑝-kvantilynormovaného normálního rozdělení

Odkazy

Související dokumenty

• tvorba bariéry (mokré nebo suché), selektivní nakládání a izolace sulfidických odpadů, mísení s jinými anorganickými materiály a organickými odpady,

1: Simulačním experimentem byly získány doby obsluhy v systému hromadné obsluhy v [min], datový soubor je uložen v

1) Bodový odhad – parametr populace aproximujeme jedním číslem. 2) Intervalový odhad – parametr populace aproximujeme intervalem, ve kterém jeho hodnota leží s

F-test (test shody rozptylů) Intervalový odhad poměru rozptylů,

c) Určete bodový a 95% intervalový odhad rozdílu středních hodnot (resp. mediánů) velikost zrn abrazivní složky typu A1 a typu A2 měřené automatckou metodou.. d) Na

c) Určete bodový a 95% intervalový odhad rozdílu středních hodnot (resp. mediánů) velikost zrn abrazivní složky typu A1 a typu A2 měřené automatckou metodou.. d) Na

Bodový odhad relativního rizika (viz asociační tabulka) je RR ˆ = 5.05. Dle pozice intervalového odhadu lze soudit, že je statisticky významně vyšší.. d) Určete bodový i

c) Určete bodový a 95% intervalový odhad rozdílu středních hodnot (resp. mediánů) velikost zrn abrazivní složky typu A1 a typu A2 měřené automatckou metodou.. d) Na