• Nebyly nalezeny žádné výsledky

Hlavní práce73215_sira00.pdf, 1.8 MB Stáhnout

N/A
N/A
Protected

Academic year: 2022

Podíl "Hlavní práce73215_sira00.pdf, 1.8 MB Stáhnout"

Copied!
72
0
0

Načítání.... (zobrazit plný text nyní)

Fulltext

(1)

Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky

Analýza nezaměstnanosti v zemích EU s využitím panelových dat

DIPLOMOVÁ PRÁCE

Studijní program: Kvantitativní metody

Studijní obor: Ekonometrie a operační výzkum

Autor: Bc. Adam Široký

Vedoucí práce: doc. Ing. Tomáš Formánek, Ph.D.

Praha, květen 2021

(2)

Prohlášení

Prohlašuji, že jsem diplomovou práci na témaAnalýza nezaměstnanosti v zemích EU s využi- tím panelových datvypracoval samostatně za použití v práci uvedených pramenů literatury.

V Praze dne 18. března 2021 ...

Adam Široký

(3)

Poděkování

Tímto bych rád poděkoval doc. Ing. Tomáši Formánkovi, Ph.D. za vstřícný přístup při vedení práce a za jeho věcné a cenné rady, jež výrazným způsobem napomohly zvýšit úroveň celé práce. Dále bych chtěl poděkovat přítelkyni a rodičům za podporu při psaní práce.

(4)

Abstrakt

Tato práce se zabývá ekonometrickou analýzou nezaměstnanosti států EU v letech 2007 - 2017. Cílem je vytvořit model, který dobře zachycuje dynamiku vývoje nezaměstnanosti napříč členskými státy Evropské unie. Vzhledem k povaze problému jsou využity metody odhadů speciálně navržené pro panelová data. Proměnné modelu, vysvětlující vývoj míry nezaměstnanosti, jsou vybrány na základě teoretických poznatků, jejichž předpokládaný vliv je diskutován. Zvolená data jsou nejprve zkoumána pro svou vhodnost ve smyslu využití při práci s panelovými daty. Je proveden odhad pomocí sdružené metody nejmenších čtverců, metody fixních efektů a metody náhodných efektů. Pomocí statistických testů a metrik vy- užívaných v oblasti ekonometrie je zvolena pro analyzovaný datový soubor vhodná metoda, která je dále podrobena bližšímu zkoumání a její regresní parametry jsou podrobeny testům stability. Výsledná síla a směr vlivu jednotlivých regresorů jsou interpretovány a porovnány s teoretickým předpokladem.

Klíčová slova

panelová data, nezaměstnanost, metoda fixních efektů, metoda náhodných efektů

JEL klasifikace C33, E20, E27

(5)

Abstract

This thesis follows up econometric analysis of unemployment in EU countries between 2007 and 2017. The aim is to construct model which can handle dynamics of unemployment across the member countries of European union. According to the structure of the problem there are used special methods of panel data modeling. The choice of independent variables of the model is based on theoretical macroeconomic knowledge about factors which influence unemployment. Expected influence of these factors is discussed. Firstly, the analysed data- set is examined from point of view of suitability for analysis in panel data models. Then pooled OLS model, fixed effect model and random effect model are estimated. With usage of statistical tests and econometric metrics the optimal model is chosen and is furthermore examined. Regression parameters of this model are tested for stability. Results of the analysis and influence of regressors are interpreted and compared with theoretical assumptions.

Keywords

panel data models, unemployment, fixed effect models, random effect models

JEL classification

C33, E20, E27

(6)

Obsah

Úvod 9

1 Nezaměstnanost 10

1.1 Základní pojmy . . . 10

1.2 Členění nezaměstnanosti dle příčiny vzniku . . . 11

1.3 Okunův zákon . . . 12

1.4 Phillipsova křivka . . . 13

2 Evropská Unie 15 3 Odhadové metody na panelových datech 18 3.1 Pooled OLS metoda . . . 19

3.2 Metoda fixních efektů . . . 20

3.3 Metoda náhodných efektů . . . 22

3.4 Statistické testy na panelových datech . . . 24

4 Data a proměnné 31 4.1 Nezaměstnanost . . . 32

4.2 Sociální dávky v nezaměstnanosti . . . 33

4.3 Jednotkové mzdové náklady . . . 34

4.4 Podíl vysokoškolsky vzdělaných . . . 36

4.5 Výše státního zadlužení . . . 36

4.6 Hospodářské cykly . . . 37

4.7 Příliv zahraničního kapitálu do Irska . . . 38

4.8 Příprava proměnných . . . 39

5 Ekonometrická analýza nezaměstnanosti 41 5.1 Pooled OLS model . . . 41

5.2 FE model . . . 45

5.3 RE model . . . 48

5.4 Vyhodnocení modelů . . . 51

6 Testování stability regresních parametrů 58

Závěr 62

Seznam použité literatury 63

Příloha 66

(7)

Seznam obrázků

1.1 Rozklad Beveridgovy křivky na cyklickou a frikční nezaměstnanost . . . 12 2.1 Podíl členských zemí EU na jejím celkovém HDP . . . 16 2.2 Vývoj HDP na obyvatele dle skupin států v čase . . . 17 3.1 Vztah mezi rozděleními kritických hodnot a testové statistiky u DW testu . . . . 27 4.1 Vývoj nezaměstnanosti v zemích EU v letech 2007 - 2017 vyjádřený v procentech 32 4.2 Vývoj poměru výdajů na podporu v nezaměstnanosti vzhledem k HDP v zemích

EU v letech 2007 - 2017 vyjádřený v procentech . . . 34 4.3 Bazický index jednotkových mzdových nákladů v roce 2017 vyjádřený v procen-

tech, rok 2010 = 100 . . . 35 4.4 Zadlužení vůči HDP v zemích EU v letech 2007 - 2017 vyjádřené v procentech . 37

(8)

Seznam tabulek

4.1 Základní popisné statistiky proměnných . . . 39

4.2 Korelační matice regresorů . . . 39

4.3 Levin-Lin-Chu test jednotkového kořene pro proměnné modelu . . . 40

5.1 Odhad výchozího Pooled OLS modelu . . . 42

5.2 Robustní odhad směrodatných chyb výchozího Pooled OLS modelu . . . 43

5.3 Odhad upraveného pooled OLS modelu . . . 43

5.4 Robustní odhad směrodatných chyb upraveného pooled OLS modelu . . . 44

5.5 Odhad výchozího FE modelu . . . 45

5.6 Robustní odhad směrodatných chyb výchozího FE modelu . . . 46

5.7 Odhad upraveného FE modelu . . . 47

5.8 Robustní odhad směrodatných chyb upraveného FE modelu . . . 48

5.9 Odhad výchozího RE modelu . . . 49

5.10 Robustní odhad směrodatných chyb výchozího RE modelu . . . 50

5.11 Odhad upraveného RE modelu . . . 50

5.12 Robustní odhad směrodatných chyb upraveného RE modelu . . . 51

5.13 Porovnání jednotlivých modelů . . . 52

5.14 Breusch Pagan LM test rozptyluai . . . 54

5.15 Chow test strukturálních změn v čase . . . 54

5.16 Hausman test na panelových datech . . . 55

5.17 Test průřezové závislosti panelových dat v FE modelu . . . 56

6.1 Porovnání dílčích FE modelů odhadovaných na subregionech EU . . . 59

6.2 Porovnání dílčích FE modelů odhadovaných za různá časová období . . . 60

(9)

Úvod

Ve světě tržní ekonomiky je nezaměstnanost jeden z nejsledovanějších makroekonomických ukazatelů. Oproti mnoha jiným, jako je HDP nebo obchodní bilance, se přímo týká každého z nás a výrazným způsobem ovlivňuje poměry ve společnosti. V Evropě je právě nezaměst- nanost jeden z nejpodrobněji zpracovaných ukazatelů, což poskytuje možnost ji podrobně analyzovat napříč jednotlivými státy z různých úhlů pohledu. Země starého kontinentu jsou, co se týče ekonomiky a obchodu, úzce provázány, což vede k tomu, že napříč jimi je výše nezaměstnanosti ovlivňována stejnými faktory. Ovšem zatímco v některých státech se neza- městnanost pohybuje v nižších jednotkách procent a v čase je téměř neměnná, v jiných zemích lze pozorovat její vysokou fluktuaci. Některé země se naopak dlouhodobě potýkají s její sta- bilně vysokou mírou. Tato práce si klade za cíl vytvořit ekonometrický model zachycující dynamiku vývoje nezaměstnanosti napříč zeměmi EU v čase.

Model bude vytvořen s využitím metod regresní analýzy a vzhledem k povaze problému budou využity nástroje pracující s panelovými daty. Aplikovány budou tři odhadové metody, a to FE metoda 1, RE metoda 2 a Pooled OLS metoda 3, přičemž každá z nich pracuje s rozdílnými předpoklady. Z výsledných modelů bude na základě statistických testů vybrán ten nejvhodnější. V práci budou využita sekundární data z databází Eurostatu4. Ta budou zachycovat nejen míru nezaměstnanosti pro jednotlivé státy v čase, ale i faktory, které ji z hlediska ekonomické teorie ovlivňují. Vhodnost jednotlivých regresorů bude hodnocena nejen na základě teoretických znalostí, ale také ve smyslu jejich statistické významnosti v modelu.

Bude rovněž zkoumán směr závislosti zvolených faktorů a bude porovnáván s ekonomickými teoretickými předpoklady. Analýza bude prováděna na souboru obsahujícím data 28 států EU

5 v časovém období od roku 2007 do roku 2017. Veškeré modely budou řešeny v programu R.

V první části práce je věnována pozornost teoretickým poznatkům o nezaměstnanosti a jejích typech. Poté jsou uvedeny dále využité modely včetně jejich předpokladů a další teoretický aparát nutný ke správnému posouzení a vyhodnocení analýzy.

Dále jsou popsány faktory, které ji ovlivňují a pro každý z nich je diskutován jejich předpo- kládaný směr závisloti. Posléze jsou odhadnuty výše zmíněné modely a je provedeno jejich otestování vůči výskytu autokorelace náhodné složky a heteroskedasticity. Na základě těchto testů jsou modely dále vhodně upraveny a porovnány mezi sebou. Nejvhodnější model je následně podroben testování ve smyslu stability jednotlivých vysvětlujících proměnných na submaticích dat původního datového souboru. Na závěr této kapitoly jsou diskutovány dosa- žené výsledky.

1celým názvem angl. Fixed effect method.

2celým názvem angl. Random effect method.

3celým názvem angl. Pooled ordinary least squares method.

4celým názvem ang. European Statistical Office

5včetně Velké Británie

(10)

1. Nezaměstnanost

1.1 Základní pojmy

Nezaměstnanost je z makroekonomického hlediska negativní jev, kdy dochází k nerovnováze na trhu práce. Jako nezaměstnaný je vedený takový člověk, který nemůže najít práci, ale zároveň aktivně práci hledá a jedná se o osobu, která je schopna výkonu aktivní práce.

V případě, že je uvažována tržní ekonomika, nezaměstnanost jedince nemá vliv pouze na něj, ale určitý dopad má na celou společnost. Určitým způsobem je zatížena ekonomicky aktivní skupina obyvatel tak, že břemeno placení daní přechází na ni. Tím pádem dochází ke zvýšení daňového zatížení ekonomicky aktivního obyvatelstva. Druhým faktorem je fakt, že část vybraných daní je alokována na podporu v nezaměstnanosti. (Sirovátka et al., 2003) I přesto, že veřejností je nezaměstnanost vnímána ve skrze negativně a je reprezentována jako ukazatel, který brzdí ekonomický růst, její působení vyvolává i pozitivní efekty. Tím hlavním je tvorba konkurenceschopnosti na pracovním trhu. To má za následek oddělení méně kvali- fikované části obyvatelstva od té kvalifikované. V době, kdy je na trhu práce situace převisu nabídky nad poptávkou, tedy počet volných pracovních míst je nižší než počet nezaměst- naných, lze říci, že je vyvijen tlak na potenciální zaměstnance. Tím bývá mnohdy dosaženo zvýšení kvalifikovanosti uchazečů. Na druhou stranu, v dobách ekonomické konjunktury, kdy je situace opačná a dochází k převisu poptávky nad nabídkou, může být naopak tlak na zaměstnavatele, kteří jsou nuceni zvyšovat mzdy či snižovat nároky. (Junankar, 2015) Nezaměstnanost je potřeba vnímat pouze z pohledu ekonomicky aktivního obyvatelstva. To je taková skupina obyvatelstva, kam se řadí zaměstnaní lidé a lidé nezaměstnaní, ale práci aktivně hledající nebo čekají, až se budou do práce moci do dočasném časovém úseku vrátit.

Ekonomicky neaktivníjsou pak ti, kteří nejsou zaměstnaní a práci aktivně nehledají, zejména studenti a senioři.

Dále je potřeba definovat osoby zaměstnané a nezaměstnané. Zaměstnaná osoba je ekono- micky aktivní osoba, která bydlí na sledovaném území a v průběhu posledního týdne pra- covala alespoň jednu hodinu za mzdu nebo za úplatu, případně měla uzavřenou pracovní smlouvu se zaměstnavatelem.Nezaměstnaná osobaje člověk ekonomicky aktivní a bydlící na sledovaném území a splňující zároveň všechny podmínky níže:

• Osoba nesmí být zaměstnaná ani sebezaměstnaná.

• Tato osoba hledá aktivně práci alespoň po dobu posledních 4 týdnů.

• Osoba je schopna během 14 dnů nastoupit do práce.

Z dlouhodobého pohledu v ekonomice převažuje jistá úroveň nezaměstnanosti nazývaná při- rozená míra nezaměstnanosti. Tato veličina udává úroveň tohoto ukazatele, při níž jsou různé trhy práce v rovnováze. Tlak na růst mezd a cenové hladiny je přibližně stejný. Na úrovni

(11)

přirozené míry nezaměstnanosti se ekonomika pohybuje v případě, že je ve stavu dlouhodobé rovnováhy. Přirozená míra nezaměstnanostiu se určí dle jednoduchého vzorce:

u= U

U +L, (1.1)

který udává podíl nezaměstnaných na aktivním obyvatelstvu. Přirozenou míru nezaměstna- nosti lze rozložit na dvě složky, nezaměstnanost strukturální a frikční. (Holman, 2010). Tyto druhy nezaměstnanosti budou blíže popsány v následující podkapitole.

1.2 Členění nezaměstnanosti dle příčiny vzniku

Frikční nezaměstnanost je spjata s působením životního cyklu aktivního obyvatelstva.

Její podstatou je vznik z důvodu migrace obyvatelstva nebo hledání prvního zaměstnání po absolvování školy. Zároveň se sem řadí i osoby, které dobrovolně zaměstnání opustily a momentálně hledají nové. Tento typ nezaměstnanosti má spíše krátkodobou povahu a v ekonomice je vnímán do jisté míry pozitivně, jelikož je znakem pružnosti na trhu práce. Lidé totiž hledáním nové práce optimálně alokují své pracovní síly a maximálně využívají svůj potenciál.

Strukturální nezaměstnanost vzniká v případě nesouladu nabídky a poptávky na trhu práce v určitém odvětví. Faktorů zpsůsobujících její vznik je několik:

• Strukturální změny v ekonomice: Často vzniká z důvodu restrukturalizace některých odvětví ekonomiky, ať už z důvodu společenského vývoje, či z důvodu neprofitability stávajícího řešení. V současnosti je tento faktor spjat zejména s odvětvími v těžkém strojírenství nebo těžebním průmyslu.

• Technologické změny: V poslední dekádě lze zejména u výrobních a strojírenských fi- rem sledovat trend automatizace či robotizace. Tento trend je do určité míry "brž- děn"vysokými vstupními náklady a častou nerentabilitou aplikace takového řešení. Lze ale do budoucna předpokládat v této oblasti postupný rozvoj a tím vliv tohoto faktoru na celkovou nezaměstnanost za více významný.

• Profesní imobilita: Jinými slovy nízká schopnost adaptace obyvatelstva na jinak kvali- fikačně zaměřenou práci. Úzce souvisí s oběma předchozími faktory. Často se projevuje po technologických změnách v odvětvích s nižší přidanou hodnotou výstupu. Obecně platí, že nižší profesní imobilitu má populace s nižším průměrným vzděláním.

• Geografická imobilita: Projevuje se zejména ve státech s méně rozvinutou dopravní infrastrukturou nebo s nízkou hustotou zalidnění.

Institucionální nezaměstnanost je typ nezaměstnanosti způsobený umělými zásahy do podmínek svobodného trhu. Těmito zásahy jsou myšleny zejména mzdové regulace a nasta- vování výše minimální mzdy ze strany státu. To vede ke snížení poptávky po práci. Dalším

(12)

nástrojem negativně ovlivňujícím nezaměstnanost může být stanovení výše sociálních dávek, kdy se s jejich zvyšováním naopak snižuje nabídka na pracovním trhu z důvodu nižší motivace lidí hledat si zaměstnání (Cahlík, 1998).

Cyklická nezaměstnanostvzniká v souvislosti s hospodářskými cykly. Během recese do- chází k plošnému poklesu poptávky po práci a tím ke zvýšení nezaměstnanosti, přičemž při fázi expanze ekonomiky se míra nezaměstnanosti snižuje. Doba trvání recese může být různá, avšak neměla by trvat déle než dva roky. Cyklická nezaměstnanost na rozdíl od struktu- rální postihuje plošně celý trh. Často bývá složité rozpoznat, zda se na daném trhu jedná o cyklickou nebo frikční nezaměstnanost. Vztah mezi nimi je určen Beveridgeovou křivkou.

Obrázek 1.1: Rozklad Beveridgovy křivky na cyklickou a frikční nezaměstnanost Zdroj: (Michaillat et al., 2021).

Jak lze vyčíst z obrázku 1.1, s rostoucí mírou volně poptávaných pozic na trhu se míra cyklické nezaměstnanosti snižuje. V určitém bodě dosáhne dokonce hodnoty limitně blížící se nule. Oproti tomu frikční nezaměstnanost má opačný průběh. S rostoucím podílem volně poptávaných pozic roste dynamika fluktuace lidí, kteří mění dobrovolně zaměstnání. Tím dochází ke vzniku frikční nezaměstnanosti. Tato přímá závislost ovšem znovu platí pouze do určitého bodu, kdy se nabídka nasytí. Blíže je Beveridgova křivka popsána například v (Elsby et al., 2015).

1.3 Okunův zákon

Mnoha ekonomy je vývoj hrubého domácího produktu (dále pouze HDP) označován za jeden z nejvýznamnějších makroekonomických faktorů ovlivňující míru nezaměstanosti, což ostatně dokazuje i mnoho empirických analýz, např. (Jabbour et al., 2020), kde je zjištěna vysoká

(13)

citlivost mezi změnami v HDP na obyvatele a mírou nezaměstnanosti v zemích EU. Právě závislost mezi těmito dvěma veličinami jako první popsal ve svém článku Arthur Okun. Spolu s Phillipsovou křivkou je Okunův zákon (nebo spíše statistická závislost) označován za jeden za nejvýznamnějších makroekonomických zákonů.

Tento zákon popisuje výše zmíněný vztah jako nepřímý. Okun dokázal, že s poklesem reálného HDP o 1 % pod potenciální produkt dojde ke změně míry nezaměstnanosti o 0,33 % nad její přirozenou míru. Matematicky lze tento vztah zapsat jak uvádí například (Holman, 2010):

YY

Y =β(uu), (1.2)

kdeu vyjadřuje přirozenou míru nezaměstnanosti,u je skutečná míra nezaměstnanosti,Y je potenciální HDP a Y je reálné HDP. Koeficient β vyjadřuje citlivost odchylky v neza- městnanosti v závislosti na změně produktu. Dle vztahu v rovnici 1.2 lze říci, že dynamika fluktuace HDP s platností předpokladu, žeβ >1 je β - násobně vyšší než dynamika vývoje nezaměstnanosti. Nejčastěji uváděná hodnota koeficientu citlivosti je 2-3.

Problém nastává tehdy, pokud by měly být v rovnici 1.2 určeny hodnoty všech proměnných a měl by být spočítán parametrβ. Potenciální produkt ani přirozenou míru nezaměstnanosti nelze exaktně určit, tudíž se častěji citlivost změny HDP na míře nezaměstnanosti zachycuje pomocí modelu časové řady:

∆ut=β0+β1∆HDPt+ϵt, (1.3)

kde ∆utvyjadřuje změnu míry nezaměstnanosti v čase t, ∆HDPtrelativní změnu produktu v časet aϵt je náhodná složka.

1.4 Phillipsova křivka

Vztah mezi inflací a mírou nezaměstnanosti byl poprvé blíže popsán W. Phillipsem v roce 1958 (Phillips, 1958). Závislost vychází ze vztahu, který definuje rovnici agregátní nabídky jako:

P =Pe+ (1/α)(Y −Y), (1.4)

kdeP je cenová hladina,Peočekávaná cenová hladina,αudává citlivostní koeficient,Y značí produkt aY je potenciální produkt. Tento vztah je v 1.5 rozšířen o nabídkový šokv, který zachycuje krátkodobou dynamiku na trhu:

P =Pe+ (1/α)(Y −Y) +v. (1.5)

Dále je tento vztah upraven odečtením cen předchozího období:

PP−1 =PeP−1e + (1/α)(Y −Y) +v. (1.6) Diference cen lze interpretovat jako zvýšení cenové hladiny, tedy inflaci. Vztah v rovnici 1.6 lze tedy přepsat následovně:

π=πe+ (1/α)(Y −Y) +v, (1.7)

(14)

kdeπ reprezentuje inflaci. Při následné aplikaci Okunova zákona viz rovnice 1.2, jehož vajá- dření bude pro potřeby následné substituce upraveno ve tvaru (1/α)(Y −Y) =−β(u−u), dostáváme rovnici Phillipsovy křivky:

π =πeβ(uu) +v, (1.8)

kde β je koeficient citlivosti změny nezaměstnanosti od své přirozené míry vlivem změny inflace,uje míra nezaměstanosti auudává přirozenou míru nezaměstnanosti. Význam všech zbylých parametrů zůstává stejný. (Moloi et al., 2020).

Z obdobných důvodů jako v případě Okunova zákona, i zde nastává problém s odhadem přirozené míry nezaměstnanosti. Proto lze celý vztah vyjádřit pomocí regresního vztahu1:

y+α=βuγ, (1.9)

kdeα je předem zvolená konstanta,β aγ jsou koeficienty odhadnuté pomocí OLS2 ayznačí míru změny mezd, která byla později Paul A. Samuelsonem a Robertem M. Sollowem nahra- zena inflací. Přičemž byl předpokládán vztah π = yn, kden vyjadřuje růst produktivity práce.

Je důležité zmínit, že v dlouhém období jsou míra nezaměstnanosti a inflace indiferentní, phillipsova křivka má vertikální tvar.

Vliv HDP a míry inflace bude spolu s jinými faktory zahrnut do regresního odhadu v praktické části práce. Přičemž bude zajímavé sledovat, zda vliv těchto ekonomických ukazatelů bude korespondovat s výše popsanými teoretickými předpoklady.

1V rámci zachování homogenního značení proměnných bylo v rovnici 1.9 oproti verzi uváděné v (Phillips, 1958) značení upraveno

2celým názvem angl. Ordinary least squares method

(15)

2. Evropská Unie

V praktické části práce jsou analyzována data týkající se nezaměstnanosti a ostatních faktorů v rámci členských států Evropské Unie (dále jen EU). Proto je příhodné uvést EU v širším kontextu. Ta zde bude charakterizována nejen jako celek, ale dojde k jejímu rozčlenění na skupiny států, které jsou si geograficky či hospodářsky blízké.

Pojem EU lze definovat jako politickou a ekonomickou unii dnes již 27 členských států 1. Založena byla v roce 1993 a jejím předchůzcem bylo Evropské Hospodářské společenství, které bylo zpočátku tvořeno šesti státy západní Evropy. Postupně byly začleňovány i ostatní země, přičemž do roku 2020 jich přibylo 22.

Smyslem vzniku celé unie byla integrita členských států mimo jiné v oblastech prosazování míru, udržitelného rozvoje a zvyšování ekonomické soudržnosti. Dalším cílem bylo, a dodnes je, vytvoření jednotné měnové unie (Základní informace o EU, 15. 02. 2021). Právě poslední dva zmíněné body přispívají k tomu, že celá EU je velmi úzce ekonomicky provázaná, čímž vytváří robustní celek. Nynější EU se v roce 2017 podílela 16 % na celosvětovém HDP a řadí se na pozici největšího obchodního uskupení na světě. Provázanost ekonomiky na druhou stranu však může způsobovat vyšší citlivost změny ekonomických ukazatelů v dílčích státech na ekonomickou prosperitu jiných členských zemí. Tato senzitivita je ještě vyšší mezi státy, které mají společnou evropskou měnu Euro. Právě měnová integrita totiž eliminuje schopnost zemí reagovat pomocí nástrojů měnové politiky na různé situace na trhu.

Síla vlivu dané země na změnu hospodářských poměrů, jak v jiných státech tak v celé EU, je přímo úměrná tomu, jak se tato země podílí na celkovém HDP EU. Podíly jednodnotlivých zemí zobrazuje obrázek 2.1.

Jak již bylo zmíněno, v praktické části není EU vnímána pouze jako celek, ale pro testování stability parametrů v modelu je členěna na podmnožiny států. Jednotlivé clustery tvoří státy s podobnou sociogeografickou specifikací.

Státy Višegrádské čtyřky

Státy V4, jak bývají často zkratkou označovány, tvoří regionální uskupení čtyř středoev- ropských států. Jsou to Polsko, Česká republika, Maďarsko a Slovensko. Uskupení vzniklo v roce 1991 a hlavním důvodem byl společný historický kontext a cíl evropské integrace. Vzá- jemná spolupráce se týká hlavně oblasti veřejné správy, nicméně je kladen důraz i na realizaci společných hospodářských projektů (About the Visegrad Group, 16. 02. 2021).

Při porovnání úrovní makroekonomických ukazatelů dílčích zemí je zřejmé, že jsou všechny státy na srovnatelné hospodářské a sociální úrovni. U všech zemí je podíl průmyslové vý- roby na HDP značný a výrazně převyšuje průměr EU. To má za následek vyšší senzitivitu

1V práci bude analyzován soubor čítající 28 států včetně VB, která z EU vystoupila až mimo sledované období v roce 2020.

(16)

Obrázek 2.1: Podíl členských zemí EU na jejím celkovém HDP Zdroj: vlastní tvorba.

růstu míry nezaměstnanosti během hospodářské recese. Tehdy totiž bývá průmysl jednou z nejvíce zasažených oblastí. Dalším společným rysem je vysoká míra navázanosti ekonomiky na Německo. Německé firmy často využívají komparativně levnější pracovní sílu těchto zemí a přesouvají do nich část výroby.

Severské státy

Jak již z názvu vyplývá, do této skupiny se řadí země severní Evropy. Jedná se o Dánsko, Finsko, Švédsko, Island a Norsko. V práci však nebudou zpracovávány informace o posledních dvou jmenovaných, jelikož nejsou součástí EU. Tyto státy netvoří žádné uskupení jako státy V4, ale jsou si blízké svým přístupem z pohledu sociální a hospodářské politiky. Spojuje je především systém vysokého mzdového zdanění, který je ovšem kompenzován vysokými inves- ticemi do oblastí vzdělání či infrastruktury. Z hlediska trhu práce je důležité zmínit specifikum skandinávského systému spočívajícím ve vysokých výdajích v oblasti sociálního zabezpečení, jako jsou starobní důchody nebo sociální podpora v nezaměstnanosti. Aby bylo ovšem toto řešení udržitelné, je v těchto státech vyžadována vysoká produktivita práce a vysoká zaměst- nanost (Andersen, 2007). V severských zemích, jak jsou často nazývány, rovněž není zákonem stanovená výše minimální mzdy.

Pobaltské státy

Do této skupiny států se řadí Estonsko, Lotyššsko a Litva. Ani tato skupina zemí netvoří oficiální uskupení, ale mají obdobně jako státy V4 identický historický vývoj a podobnou strukturu hospodářství. Baltští tygři, jak jsou taktéž nazýváni, zažili po pádu želežné opony silný ekonomický růst. Ovšem pouze do doby, než se v roce 2008 projevila celosvětová eko- nomická recese. V této době se pobaltské státy propadly do hluboké hospodářské recese. V

(17)

porovnání se zbytkem EU byl tento propad o poznání větší. Od té doby se tyto země potýkají s cyklickými recesemi ekonomiky. Dle empirických výzkumů existuje hned několik příčin. První z nich je nedostatečná investice do vzdělávání. Méně vzdělaná populace má totiž obecně nižší schopnost adaptace při změnách zaměstnání. Druhým faktorem, který tyto země spojuje a je příčinou nestabilní ekonomiky, je nízká přidaná hodnota exportního zboží. Jako významný se ukázal také vliv rychle stárnoucí populace v těchto zemích (Staehr, 2015).

Státy jižní Evropy

Poslední skupina států EU, která bude v praktické části samostatně vystupovat, jsou státy jižní Evropy. Ze členských států EU se sem řadí Portugalsko, Španělsko, Itálie, Řecko, Malta a Kypr. Z ekonomického hlediska mají tyto státy společné to, že je jejich průmysl orientován zejména na výrobu zboží s nízkou přidanou hodnotou. U všech z nich také tvoří cestovní ruch významný podíl celkového HDP, což má za následek vysokou míru sezonní nezaměst- nanosti. Ta je zejména mezi mladými lidmi do 25 let věku extrémně vysoká. Ve Španělsku u této věkové skupiny dosahuje stabilně více než 30 %. Právě Španělsko s Řeckem se potýkají dlouhodobě s nejvyšší mírou nezaměstnanosti v celé Evropě (Serapioni et al., 2019). S eko- nomickou konjunkturou v minulé dekádě se ale i zde míra nezaměstnanosti snižovala. Tento trend byl navíc podpořen tím, že byl zaznamenán vysoký podíl mladých lidí, kteří začali hledat práci v zahraničí.

Z výše popsaného je evidentní, že každá skupina států se nachází v jiné ekonomické situaci a země Evropy tedy tvoří poměrně diverzifikovaný celek. Celkovou ekonomickou výkonnost a úroveň zachycuje mnoho ukazatelů, nejčastěji používaným bývá výše HDP na obyvatele. Jeho vývoj v čase pro jednotlivé skupiny států zobrazuje obrázek 2.2. Lze sice předpokládat, že vzhledem k úzké provázanosti zemí EU je nezaměstnanost v různých částech Evropy ovlivňo- vána stejnými faktory, síla jejich vlivu se však pravděpodobně napříč jimi liší. Na parciálních submodelech pro jednotlivé skupiny států by tedy mělo být vhodné v praktické části otestovat stabilitu faktorů, jež budou tvořit model.

Obrázek 2.2: Vývoj HDP na obyvatele dle skupin států v čase Zdroj: vlastní tvorba.

(18)

3. Odhadové metody na panelových datech

Panelová data vznikají kombinací průřezových dat a časových řad. Důvodů, proč je k analýze využít, může být více. Například může jít o záměr rozšířit datový soubor průřezových datT - násobně, kdyT je délka zvoleného časového období. Nejčastěji ale vhodná aplikace na daný problém vyplývá z jeho podstaty. Obecně je sledováno N pozorovaných objektů v rámci K znaků zaT pozorovaných období. Důležité je umět rozlišit dva termíny, a to panelová data a pooled cross-section data. Prvním termínem se rozumí určitý výběrový vzorek, který je zkoumán v čase a jeho struktura je neměnná (Wooldridge, 2016). Oproti tomu panelová data jsou rovněž zvolená náhodným výběrem, nicméně vzhledem k jednotlivým časovým úsekům je předpokládána jeho homogenita.

Panelová data lze dělit dle různých hledisek. Prvním z nich je dimenzionální dělení na krátké a dlouhé panely. U krátkých panelů se vychází z platnosti vztahuNT, v opačném případě se hovoří o dlouhých panelech. V případě, že seN = 1, jedná se o průřez jednoho pozorování v čase, tedy o časovou řadu. Naopak, když T = 1, tak má dataset strukturu průřezových dat. Z toho vyplývá, že v případě dlouhých panelů se přistupuje k analýze obdobně jako u časových řad. Je tedy vhodné pracovat se stacionaritou dat a nebo slabou závislostí. Při práci s krátkými panely je naopak přístup obdobný jako při zpracování průřezových dat.

Druhým způsobem, jak lze panelová data členit, je dle jejich struktury na vyrovnaná a ne- vyrovnaná. Panel je vyrovnaný právě tehdy, když je počet záznamů pro každou průřezovou jednotku v čase stejný, jinými slovy když, v matici dat jsou všechna pozorování v čase kom- pletní. V praxi se však lze častěji setkat s nevyrovnanými panely. To znamená, že pro nějaký záznam chybí údaje alespoň za nějakýtT. (Greene, 2018). Princip níže diskutovaných me- tod je při práci s vyrovnanými a nevyrovnanými panely téměř identický. Drobné úpravy, které jsou potřeba provést zejména v oblasti směrodatných chyb, však software R-studio využitý pro analýzu řeší automaticky, tudíž jim v této práci nebude věnována pozornost. (Croissant et al., 2008). Jediným závažnějším problémem, který by při analýze nevyrovnaného panelu mohl nastat je, že by důvod nevyrovnanosti dat významně ovlivňoval jejich charakter. Na- stává to často u dat, u kterých je zkoumán určitý negativní faktor, který zároveň ovlivňuje v čase homogenitu průřezového vzorku. Konkrétním příkladem může být analýza kredibility firem. Pro některé firmy mohou chybět data za určité roky, jelikož firma zanikla z důvodu insolvence. Právě taková data by však pro model přinášela významnou část informace.

Data s panelovou strukturou lze maticově vyjádřit následovně:

(19)

yi=

yi1 yi2 ... ynT

,Xi=

Xi11 Xi12 . . . Xi1k Xi21 Xi22 . . . Xi2k ... ... ... ... XnT1 XnT1 . . . XnT k

,ei=

ei1 ei2 ... enT

,

kdeyit proi= 1,2,...,N a t= 1,2,...,T je hodnota vysvětlované proměnné pro pozorování iv časet. HodnotaXitjproi= 1,2,...,N,t= 1,2,...,T aj= 1,2,...,K, představuje hodnotuj-tého regresoru pro pozorováníiv časetaϵitje náhodná složka pro pozorováníiv časet(Pánková, 2007). V další části práce již budou veškeré modely zapisovány v sumačním vyjádření či jeho rozvinutém tvaru.

Lineární model pracující s panelovými daty lze zapsat následovně:

yit=β0+

K

∑︂

j=1

βjxitj+ai+uit, ∀i, ∀j, ∀t. (3.1) Náhodná složka modeluϵit je v tomto případě chápána jako:

ϵit=ai+uit, (3.2)

kdeai je individuální heterogenita v modelu. Ta představuje v čase neměnnou složku, která u každé průřezové jednotky zohledňuje informaci, jež není v modelu zahrnuta a je v čase neměnná. Jedná se především o individuální predispozice.

Vzhledem ke specifické struktuře dat a předpokladu existence individuální heterogenityai je vhodné využít k odhadu modelů speciálně určené metody, ale za určitých předpokladů lze aplikovat i OLS. V dalších částech práce bude věnována pozornost odhadu jak pomocí OLS, tak i speciálních odhadových metod FE modelu a RE modelu.

3.1 Pooled OLS metoda

Nejjednodušším přístupem k odhadu modelu na panelových datech je aplikace klasické me- tody nejmenších čtverců ( dále pouze jen OLS). Ta vychází z předpokladu minimalizace SSR1 modelu:

SSR=

N

∑︂

i=1

(yitβˆ︁0

K

∑︂

j=1

βˆ︁jxitj)2 →min. (3.3) V případě práce s panelovými daty je však třeba uvažovat, že tato metoda nedokáže s takovou strukturou dat pracovat. Data tedy nejsou analyzována jako panel, ale jsou sdružená přes všechnaiatdo jedné regrese. Taková metoda se nazývá sdružená metoda nejmenších čtverců (Pooled OLS). Výchozí rovnice má následující tvar:

yit=β0+

K

∑︂

j=1

βjxitj+ϵit, ∀i, ∀j, ∀t. (3.4)

1celým názvem angl. Sum of Squares Error

(20)

Tato metoda neuvažuje předpoklad existence individuálního efektu napříč pozorováními a platí tedyai = 0 proi= 1,2, . . . ,n. Tento předpoklad bývá často problematický, jelikož mezi průřezovými jednotkami lze téměř vždy pozorovat rozdíly a je tedy možné existenci indi- viduální heterogenity předpokládat. Pokud je však předpoklad o její neexistenci splněn, je výsledný odhad nezkreslený a konzistentní. Zároveň s tím však musí platit i klasické předpo- klady OLS, jak uvádí například (Greene, 2018):

Předpoklad OLS.1: Funkční forma odhadového tvaru rovnice je stejná. jako v 3.4.

Předpoklad OLS.2: Průřezová pozorování pochází z náhodného výběru.

Předpoklad OLS.3: Střední hodnota náhodné složky podmíněná maticí regresorů je nulová. Pro ∀i,∀tplatí:

E(eit |Xi) = 0. (3.5)

Předpoklad OLS.4: Neexistence heteroskedasticity reziduí. Pro ∀i,∀tplatí:

var(eit|Xi) =var(eit) =σe2. (3.6)

Předpoklad OLS.5: Nepřítomnost autokorelace náhodné složky. Prot̸=splatí:

cov(eit,eis|Xi) = 0. (3.7)

Předpoklad OLS.6: Regresory nejsou mezi sebou korelovány. Matice Xi má plnou hodnost.

Předpoklad OLS.7: Náhodná složka podmíněná maticí regresorů Xi má normální rozdělení.

V případě, že je v modelu individuální heterogenita přítomná, je odhad pomocí OLS zkreslený a nekonzistentní.

3.2 Metoda fixních efektů

Druhou diskutovanou metodou, kterou lze aplikovat, je metoda fixních efektů (dále jen FE metoda). V tomto případě je již oproti předchozímu modelu uvažována existence individuál- ního efektu. Ten je pro každou průřezovou jednotku fixní. Důležité je, že metoda předpokládá platnost vztahu:

corr(ai,xit)̸= 0, (3.8)

čímž je však porušena exogenita regresorů. Tento problém je v případě FE metody řešen eliminací parametruai.

Pro následnou jednodušší práci během úprav bude pracováno s rozvinutým zápisem výchozí rovnice 3.1:

yit =β1xit1+· · ·+βKxitK+ai+uit, ∀i, ∀j, ∀t. (3.9)

(21)

FE transformace spočívá ve zprůměrování jednotlivých proměnných modelu v čase pro každé pozorováníi:

yi=β1xi1+· · ·+βKxiK+ai+ui, ∀i, ∀j. (3.10) Jak je uvedeno ve (Wooldridge, 2016), lze rozlišit dva různé přístupy k této transformaci.

První z nich se nazývá Within estimator. Ten zachycuje pro každé i vývoj proměnných v čase. Jeho princip spočívá v odečtení průměrů pro každé i přes všechna t od původního modelu, čímž dostáváme následující tvar:

yityi =β1(xit1xi1) +· · ·+βK(xitKxiK) + (uitui), ∀i, ∀j, ∀t. (3.11) Between estimátor je postaven na principu, že je spočtena odchylka průměru pro každou průřezovou jednotku od celkového průměru, a to pro každou proměnnou. Je tedy aplikován vztah yiy. Do modelu je zahrnut i intercept β0. Zjevnou nevýhodou tohoto estimátoru je ignorování informace, jak se proměnné vyvijí v čase. Další nevýhodou je, že odhad je konzistentní pouze tehdy, když platí nezávislost mezi ai a xit. V takovém případě je ale vhodnější pro odhad použít RE estimátor, který bude popsán níže. Vzhledem k tomu bude nadále pracováno pouze s Within estimátorem. Je však důležité zmínit, že transformací v 3.11 je při každém zprůměrovaném pozorování ztracen jeden stupeň volnosti. S tím ovšem balíček "plm", který bude využit k analýze v praktické části, pracuje automaticky. (Croissant et al., 2008)

Po aplikaci substituce:y..it=yit−yi v rovnici 3.11 analogicky aplikované i na zbylé proměnné, je tvar v rovnici 3.12 finálním modelem. Ten je nadále odhadnut pomocí pooled OLS:

y..it=β1

x..it1+· · ·+βK

x..itK+u..it, ∀i, ∀j, ∀t. (3.12) Jak lze v 3.12 vidět, individuální heterogenita byla z modelu pomocí transormace eliminována, a to díky platnosti její invariance v čase. Obdobně by tomu však bylo i v případě v čase neměnných proměnných, což může být mnohdy v praktických aplikacích problém. Za takovou proměnnou lze považovat například některé binární, které charakterizují určitá pozorování.

Aby však mohla být metoda využita, musí být stejně jako v případě metody předchozí splněny její předpoklady:

Předpoklad FE.1: Funkční forma odhadovaného tvaru rovnice odpovídá tvaru v 3.9.

Předpoklad FE.2: Průřezová pozorování pochází z náhodného výběru.

Předpoklad FE.3: Každý regresor se v čase mění alespoň jednou a mezi regresory není přítomna perfektní lineární kombinace.

Předpoklad FE.4: Musí být splněna striktní exogenita regresorů. Pro ∀t a ∀s ∈ T platí:

corr(xitj,uis|ai) = 0. (3.13) Při splnění FE.1 - FE.4 lze odhad považovat za nestranný a pro T a N → ∞ za konzistentní.

Předpoklad FE.5: Neexistence heteroskedasticity reziduí. Pro ∀tplatí:

var(uit |Xi,ai) =var(uit) =σe2. (3.14)

(22)

Předpoklad FE.6: Nepřítomnost autokorelace náhodné složky. Pro t̸=splatí:

cov(uit,uis|Xi,ai) = 0. (3.15) Pokud platí FE.1 - FE.6, je odhad BLUE 2.

Předpoklad FE.7: Náhodná složka podmíněná maticí regresorů (Xi,ai) má normální rozdělení.

V případě platnosti všech předpokladů je odhad BLUE a zároveň všechny t statistiky a F statistiky mají přesněta F rozdělení (Greene, 2018).

3.3 Metoda náhodných efektů

Poslední metodou odhadu regresního modelu na panelových datech, která zde bude uvedena, je metoda náhodných efektů (dále jen RE metoda). Zde je pracováno s opačným předpokla- dem, než jak tomu bylo u metody fixních efektů. Jak již z názvu vyplývá, vychází se z faktu, že individuální efekty jsou napříč pozorováními rozděleny náhodně, je tedy předpokládán ná- hodný výběr pozorování, který je z populace vybrán k analýze. Mezitím, co předchozí metoda předpokládala, žeai je korelováno alespoň s jedním regresorem, zde platí striktní předpoklad:

cov(ai, xitj) = 0, ∀i, ∀j, ∀t, (3.16) kdy je předpokládána nulová korelace mezi individuální heterogenitou a všemi regresory pro všechna časová období. Tento předpoklad však bývá, zejména v analýzách ekonomického typu, zřídkakdy splněn. Pokud ale splněn je (což bývá zpravidla u velkého počtu průřezových pozorování) a zároveň s ním i ostatní předpoklady modelu, bývá tento estimátor označován za vhodnější odhadovou metodu než FE metoda (Hill et al., 2011).

Výchozí rovnicí modelu je:

yit=βO+β1xit1+· · ·+βKxitK+ai+vit, ∀i, ∀j, ∀t. (3.17) Zde je pro další úpravy důležité zmínit, žeainení třeba vzhledem k předpokladu v rovnici 3.16 eliminovat a je možné s ním nadále v modelu pracovat. Pro svou povahu je v tomto případě zahrnut do náhodné složkyvit, kdy tedy platí: vit=uit+ai. Tím je ovšem způsobeno, že v čase konstatní individuální efekt přináší do náhodné složky autokorelaci v čase, tu lze vyjádřit jako:3:

ρ= cov(vit,vis)

√︁var(vit)(vis)

= σa2

σa2+σu2, t̸= s.

(3.18)

2celým názvem angl. Best linear unbiased estimator

3cov(vit,vis) =E[(ai+uit)(ai+uis)] =σa2

(23)

Přičemž je vycházeno z platnosti:σv2 =σu22a. V takovém případě je vhodná aplikace metody GLS4, která je používána právě v modelech s autokorelací náhodné složky. V tomto případě je nejprve odhadnut parametrθ, který je definován jako:

θ= 1−

√︄ σu2

σ2u+T σ2a. (3.19)

Jak je patrné z rovnice 3.19, hodnoty parametru jsou z intervalu⟨0,1⟩. Následně je provedena transformace výchozí rovnice 3.17 s cílem eliminace autokorelacevit:

yitθyi =β1(xit1θxi1) +· · ·+βK(xitKθxiK) + (vitθvi), ∀i, ∀j, ∀t. (3.20) Princip je obdobný jako u FE modelu s tím rozdílem, že nyní není od proměnné odečítán celý výběrový průměr v čase, nýbrž pouze jeho část daná hodnotou θ. Tomuto postupu se říká kvazi průměrování. V případě, žeσ2a= 0, znamenalo by to neexistenci individuálního efektu a odhad by byl stejný jako v případě Pooled OLS. V případě, že θ = 1, je naopak odhad stejný jako v u FE metody. Lze tedy usuzovat, že čím více se na variabilitě náhodné složky podílí variabilita individuální heterogenity, tím vyšší je předpoklad využití FE transformace.

Hodnoty rozptylů σu2 a σa2 nejsou při odhadu parametru θ známy, ale jak je blíže uvedeno například v (Biørn, 2017), jsou nahrazeny vhodnými odhady.

Z rovnice 3.20 je zřejmé, že výhoda RE modelu spočívá oproti FE modelu v tom, že je možno do odhadu zahrnout i v čase neměnné proměnné, aniž by byly modelem eliminovány.

I u tohoto modelu je nutno splnit jeho předpoklady, přičemž většina z nich je identická jako v případě modelu s fixními efekty. Jedná se o předpoklady FE.1, FE.2, FE.4, FE.5 a FE.6.

Předpoklad FE.7 o normální distribuci náhodné složky nemá v tomto modelu význam, jelikož je zde pracováno s odhadem parametru θ a z náhodné složky je odstraňována autokorelace.

Vzhledem k tomu, že v případě RE transformace není eliminována individuální heterogenita, je nutné některé z předpokladů FE modelu doplnit o formulace s ní pracující (Wooldridge, 2009).

Jako první je nahrazen FE.3 předpokladem RE.1, kdy je odebrán předpoklad o potřebné změně každého regresoru alespoň pro jednu časovou jednotkut. Výsledná podoba je tedy:

Předpoklad RE.1: Mezi regresory není přítomna perfektní multikolinearita.

Dále je potřeba k předpokladu FE.4 zahrnout informaci o nulové korelaci mezi individuálními efekty a maticí regresorů.:

Předpoklad RE.2: Střední hodnotaai podmíněná maticí regresorů je konstantní:

E(ai |Xi) =β0 (3.21)

Poslední změnou oproti FE modelu je rozšíření FE.5 o formulaci:

4celým názvem ang. Generalized least squares method

(24)

Předpoklad RE.3: Rozptyl ai podmíněný maticí regresorů je konečný, jinými slovy je předpokládána homoskedasticita individuálního efektu:

var(ai |Xi) =σa2 (3.22)

Pokud je splněno FE.1 ∧ FE.2 ∧ RE.1 ∧ (FE.4 + RE.2), je FE estimátor konzistentní a odhady parametrů mají asymptoticky normální rozdělení. Aby však byly validní odhady směrodatných chyb, tím pádem veškeré t-testy a F-testy, je potřeba, aby v modelu nebyla přítomna autokorelace a heteroskedasticita náhodné složky a zároveň musí být splněn i před- poklad o homoskedasticitě individuálního efektu. Jinými slovy musí být splněno (FE.5 + RE.3)∧ FE.6.

Existuje více metod, které dokáží pracovat se strukturou panelových dat viz. například (Pe- saran, 2015). Při jejich empirické analýze se však velmi často provádí odhady právě za pomoci třech výše popsaných modelů. Na každou dvojici modelů je možné aplikovat příslušný statis- tický test, který určí vhodnější z nich. Tyto, ale i jiné potřebné testy a postupy, které jsou potřeba pro detekci případného výskytu nežádoucích jevů v modelu a následnou práci s nimi, budou popsány v následující podkapitole.

3.4 Statistické testy na panelových datech

V této části jsou uvedeny veškeré statistické testy, jejichž užití je zapotřebí při odhadech modelů na panelových datech v praktické části práce. Některé z nich posuzují kvalitu re- gresních parametrů a modelu, jiné testují přítomnost výskytu určitých vlastností u náhodné složky a poslední skupinou jsou testy posuzující vhodnost jednotlivých modelů z hlediska předpokladů.

3.4.1 Dílčí t-test regresního parametru

První uvedený test zkoumá kvalitu elementární jednotky odhadového modelu, tedy regresoru.

Je jím vyjadřována statistická významnost separátně pro každý regresorxj, který v modelu vystupuje. Hodnotu testové statistiky v tomto případě udává vztah:

tβˆ

j = βˆ

j

se(βˆ

j), (3.23)

kde βˆ

j je odhad teoretické hodnoty regresního koeficientu proměnné j. Jinými slovy je vy- jadřován poměr síly vlivu regresoru s odhadem jeho směrodatné chyby. Testová statistika se řídít-rozdělením s (nk−1) stupni volnosti (Wooldridge, 2009).

Testována jeH0 vyjadřující irelevantnost regresoruxj v modelu vzhledem k míře vysvětlení variability závislé proměnné, lze ji formulovat jako:

H0 :βj = 0 H1 : non H0.

(25)

V případě jejího zamítnutí je ze statistického pohledu vhodné proměnnou z modelu vyřadit.

Z hlediska teoretických poznatků v rámci zkoumané oblasti je však zapotřebí uvažovat i její význam z této perspektivy.

3.4.2 F-test modelu

F test je v porovnání s tím předchozím více komplexní. Testuje kvalitu odhadovaného modelu, z hlediska závislosti vysvětlované proměnné na matici regresorů, jako celek. Testové kritérium má tvar:

F = (SSRrSSRur)/q

SSRur/(nk−1) ∼

H0

F(k,(n−k−1)), (3.24) kde SSRr je kvadratický součet reziduí omezeného modelu, SSRur je kvadratický součet reziduí neomezeného modelu,q je rozdíl počtu regresorů neomezeného a omezeného modelu, nje počet pozorování a kvyjadřuje počet regresorů v neomezeném modelu. Hodnota testové statistiky se v tomto případě řídíF-rozdělením s (n−k−1) stupni volnosti.

Nulovou hypotézu lze formulovat jako:

H0 :β1 =β2=· · ·=βk= 0 H1 : non H0,

což lze interpretovat jako špatně specifikovaný model, jehož všechny regresory jsou v něm nevýznamné.

3.4.3 Levin-Lin-Chu test

Jak již bylo zmíněno výše, při práci s panelovými daty je zapotřebí do určité míry postupovat obdobně jako v případě časových řad. Základním předpokladem pro to, aby bylo možné odhady na panelových datech provádět bez dalších transformací (například aplikace první diference), je zapotřebí zjistit, zda jsou data stacionární. Proměnná je stacionární právě tehdy když se její pravděpodobnostní rozdělení v čase nemění. Testování výskytu stacionarity lze pojmout jako test jednotkového kořene, tedy toho, zda jsou hodnoty proměnných závislé na svých předchozích hodnotách. K tomu poslouží Levin-Lin-Chu test jednotkového kořene upravený na práci s panelovými daty, který byl publikován například ve (Wu, 1996). Ten vychází ze vztahu:

∆y˜it=ρy˜it−1+

p

∑︂

j=1

ϕjy˜it−jeit, (3.25)

kde již je nay˜it aplikována první diference ay˜it=yityi[︂N1 ∑︁N

i=1

(yityi)]︂. Parametrρ je substitucí výrazuρ−1. Nulová hypotéza v tomto případě je:

H0 :ρ = 0 H1 : non H0.

(26)

Testové kritérium má podobu:

t= [︄ N

∑︂

i=1 T

∑︂

t=1

yit−12 ]︄1/2

(ρˆ−1) σˆ2

H0

N(0,1) asymptoticky, (3.26) přičemžσˆ2 udává průměrnou čtvercovou odchylku prvních diferencí s ohledem na parametr ρ

ˆ:

σˆ2= 1 N T

N

∑︂

i=1 T

∑︂

t=1

(yˆitρˆyit−1)2. (3.27) V případě, že dojde k zamítnutí nulové hypotézy, lze na zvolené hladině významnosti říci, že data jsou stacionární (Breitung et al., 1994).

3.4.4 Durbin-Watson test autokorelace

Tento test (dále pouze DW test) se zabývá detekcí náhodné složky v modelu. Všechny metody, které byly uvedeny výše, předpokládají nulovou autokorelaci náhodné složky, viz. předpoklady OLS.5 pro Pooled OLS metodu a FE.6, který platí zároveň pro FE i RE metodu. V případě, že je přítomnost tohoto jevu detekována, je odhad stále považovaný za nevychýlený a konzis- tentní, nicméně je nesplněna vlastnost vydatnosti, a to i té asymptotické. Autokorelace rovněž způsobuje vychýlenost odhadů a směrodatných chyb, tím pádem přestávají být validní jiné aplikované statistické testy (Hušek et al., 2007).

Může být způsobena jak špatnou specifikací modelu, v takovém případě se hovoří o kvaziau- tokorelaci, tak špatným naměřením hodnot vysvětlované proměnné.

Testuje se hypotéza:

H0 :ρ= 0 H1 : non H0,

kde H0 říká, že v modelu není přítomna autokorelace náhodné složky. Hodnota testového kritéria je dána jako:

dc=

N

∑︁

i=1 T

∑︁

t=2

(uituit−1)2

∑︁N i=1

∑︁T t=1

u2it

, (3.28)

přičemž nabývá hodnot v intervalu ⟨0, 4⟩. Při posouzení testové statistiky dc se vychází z jejího symetrického rozdělení a z kritických hodnotdLc a dU c, které pochází z rozdělenídLa dU. Pro výše popsané platí vztah:dL< dp < dU. Názorněji jsou tato rozdělení i vztah mezi nimi zobrazeny na obrázku 3.1. Jelikož přesná rozdělení testové statistiky závisí na matici regresorů X, nelze určit její přesné rozdělení. Lze však stanovit počet stupňů volnosti při platnostiH0, a tonk.

V případě, kdy je vypočtená hodnota testového kritéria v intervalu (0, dLc) nebo (4−dLc,4), je zamítnuta nulová hypotéza o nenulové autokorelaciuit, pokud jedcz intervalu (dU c,4−dU c),

(27)

Obrázek 3.1: Vztah mezi rozděleními kritických hodnot a testové statistiky u DW testu Zdroj: (Hill et al., 2011)

nelze zamítnout nulovou hypotézu. V ostatních případech je test neprůkazný (Hill et al., 2011).

3.4.5 Breusch-Pagan test heteroskedasticity

V případě náhodné složky je potřeba věnovat pozornost i eventuální přítomnosti heteros- kedasticity v modelu. V případě, že je v modelu detekována, dochází tím opět k porušení předpokladů všech uvedených modelů. Její výskyt může být způsoben z obdobných důvodů, jako v případě autokorelace náhodné složky. Odhady jsou pak sice stále nestranné a konzis- tentní, nicméně ztrácí na vydatnosti i asymptotické vydatnosti. Rovněž dochází k vychýlenosti odhadu směrodatných chyb a tím pádem nejsou spolehlivé ani všechny statistické testy.

Heteroskedasticitu je možné řešit úpravou specifikace modelu, zejména přidáním důležitých proměnných. Další možností je logaritmická transformace proměnných, či odhad robustních chyb.

Je testována nulová hypotéza o homoskedasticitě náhodné složky:

H0 :var(uit |Xi,ai) =σ2u H1 : non H0.

Existuje mnoho testů heteroskedasticity, které jsou uvedeny například v (Gujarati et al., 2009). Často využívaným je zejména kvůli své jednoduchosti Breusch Pagan test. Ten spo- čívá v tom, že je odhadnut klasický model a jsou uložena rezidua. Posléze jsou tato rezidua odhadována jako vysvětlovaná proměnná pomocí regresorů modelu:

u

ˆ2it=δ0+δ1xit1+· · ·+δKxitK, ∀i, ∀j, ∀t. (3.29)

(28)

V případě, že je model homoskedastický, rezidua nejsou žádným způsobem vysvětlována pomocí regresorů. Tato skutečnost je testována F testem o sdruženém významu regresorů.

Testová statistika máF rozdělení s (n−k−1) stupni volnosti a její výpočetní tvar má podobu stejnou jako v rovnici 3.24. Nezamítnutí nulové hypotézy značí v modelu homoskedasticitu.

Alternativou k F statistice je LM statistika (Wooldridge, 2010).

Problém vychýlení směrodatných chyb s výskytem autokorelace náhodné složky a heteroske- dasticity je v práci řešen pomocí odhadu robustních směrodatných chyb. Pro panelová data jich existuje několik typů, přičemž některé jsou robustní vůči heteroskedatsticitě, jiné vůči autokorelaci. Některé, například robustní odhad typu Arellano, jsou robustní vůči oběma je- vům (Croissant et al., 2018). A právě typ Arellano bude kvůli této vlastnosti využit i v této práci. Jeho výpočetní tvar má následující podobu:

Vcx= (ZTZ)−1

N

∑︂

n=1

ZnTeneTnZn(ZTZ)−1. (3.30)

3.4.6 Breusch Pagan LM test

Tento test se zabývá skutečností, zda se v datech vyskytuje individuální heterogenita ai. V případě, kdy v modelu není přítomna, postrádá smysl odhad pomocí RE metody, která s předpokladem její existence pracuje. Naopak odhad pomocí pooled OLS metody z neexistence individuálního efektu vychází a je v takovém případě asymptoticky validní. Lze tedy na základě testu určit, která z metod je pro uvažovaná data vhodnější. Je testována hypotéza:

H0 :σa2= 0 H1 : non H0,

přičemžH1 v modelu detekuje existenci nepozorované heterogenity. Parametrσ2a je její roz- ptyl, jehož odhadovou podobu lze určit jako:

σ

ˆ2a= 1

(N T(T −1)/2−K)

N

∑︂

i=1 T−1

∑︂

t=1 T

∑︂

s=t+1

vˆitvˆis. (3.31) Z té posléze vychází testové kritérium, jehož podrobné odvození lze nalézt v (Wooldridge, 2010):

W =

∑︁N i=1

T−1

∑︁

t=1

∑︁T s=t+1

v ˆitvˆis [︃ N

∑︁

i=1

(

T−1

∑︁

t=1 T

∑︁

s=t+1

v ˆitvˆis)2

]︃1/2

H0

N(0,1). (3.32)

To se řídí při platnosti nulové hypotézy asymptoticky normálním rozdělením. Test je robustní vůči autokorelaci náhodné složky. V případě zamítnutí H0 je použit RE model, při jejím nezamítnutí naopak pooled OLS.

Odkazy

Související dokumenty

561/2004 Sb., o předškolním, základním, středním, vyšším odborném a jiném vzdělávání (školský zákon), ve znění pozdějších předpisů, upravuje

V záznamovém archu uveďte v obou částech úlohy celý postup řešení (popis neznámých, sestavení rovnice, resp. soustavy rovnic, řešení a odpověď).. Graf

soustava rovnic a další postup řešení obsahuje právě jeden z následujících nedostatků:. - po správném výpočtu některé veličiny chybí dopočítání jakékoli z

Komise doporučuje ředitelce Centra potvrdit způsobilost předmětného didaktického testu plnit funkci validního zadání dílčí zkoušky a zkoušky konané formou didaktického

V záznamovém archu uveďte celý postup řešení (popis neznámých, sestavení rovnice, resp. soustavy rovnic, řešení a odpověď).. Úhlopříčka BD je současně

Je správně sestavena soustava rovnic a další postup řešení obsahuje právě jeden z následujících nedostatků:. - soustava rovnic je řešena s jednou chybou a dále je

Délky základen AB, CD lichoběžníku ABCD

Komise doporučuje ředitelce Centra potvrdit způsobilost předmětného didaktického testu plnit funkci validního zadání dílčí zkoušky a zkoušky konané formou didaktického