Jak jsme již zmínili, trojice Československá obchodní banka, Česká spořitelna a Komerční banka je na nejvyšších křivkách grafu, značící vhodně rozmístěnou síť z pohledu kumulativní výkonnosti. Ve srovnání nejlepších pěti nebo deseti poboček z jednotlivých sítí nejsou v této trojici žádné velké rozdíly, maximální relativní rozdíl jsou tři procenta. Na tuto trojici ztrácí z větších a středně velkých bank MONETA Money Bank i banka UniCredit, které jsou společně na nižší křivce kumulativní výkonnosti. Rozdíl mezi touto dvojicí a lepší trojicí je ve srovnání nejlepších deseti poboček kolem dvanácti procent. Při porovnání nejlepších tří poboček každé sítě se rozdíly smazávají. Equa bank má nejslabší z nejlepších poboček a podtrhuje, proč je její křivka na obrázku 3.15 nejníže.
Tabulka 3.15: Porovnání kumulativní výkonnosti nejlepších poboček ve Zlínském kraji (vlastní zpracování)
Banka Top 1 Top 3 Top 5 Top 10 Top 25
Air Bank a.s. 2.1
Československá obchodní . . . 2.0 6.0 9.4 16.3
Česká spořitelna, a. s. 2.0 5.7 9.1 16.6 28.9 Equa bank a.s. 1.8
Fio banka, a.s. 2.1 5.7 8.8
Komerční banka, a.s. 2.1 6.0 9.4 16.7 mBank S.A., organizační . . . 1.9
MONETA Money . . . 2.1 5.7 8.7 14.6 Raiffeisenbank a.s. 2.0 5.8 9.0
UniCredit Bank Czech . . . 2.0 5.6 8.7
3.16 Shrnutí krajských analýz
Mezi výše představenými kraji lze vypozorovat některé rozdíly a systematičnosti. V textu jsou kraje například rozděleny dle celkového počtu poboček na kraje malé, střední a velké.
Mezi malé kraje můžeme zařadit Karlovarský, Liberecký a Olomoucký kraj. A mezi velké kraje můžeme zařadit především Jihomoravský a Moravskoslezský kraj, Prahu a Středočeský kraj. Zbylé kraje patří mezi střední kraje.
Zajímavější je však analýza očekávané kumulativní výkonnosti pobočkových sítí, která přede-vším odkrývá, že bankovní domy napříč kraji nemění své umístění zcela náhodně. Určitá vari-abilita mezi kraji panuje, ale rozhodně se dá říct, že některé bankovní domy mají své pobočky rozmístěné lépe a některé naopak pravidelně hůře. Například již z celorepublikového srovnání se zdá, že banky Česká spořitelna, Komerční banka, Raiffeisenbank a Československá ob-chodní banka jsou mnohem efektivnější v rozmístění svých sítí. Naopak například MONETA Money Bank, UniCredit, Fio banka a mBank jsou relativně neefektivními počkovými sítěmi, navíc ani nejlepší pobočky těchto bankovních domů nejsou na tak dobré lokalitě, jako nejlepší pobočky lepších bankovních domů. Toto celorepublikové zjištění se pak pravidelně potvrzuje mezi jednotlivými kraji, tedy až na malé výjimky. Například banka UniCredit, která pravi-delně spadá mezi podprůměrně výkonné sítě (viz Jihočeský, Jihomoravský, Královéhradecký kraj apod.), je ve Středočeském kraji nejlepší bankou, protože její křivka je nejvyšší. Mezi středními a velkými bankami například pravidelně propadá MONETA Money Bank a naopak ČSOB s Raiffeisenbank jsou mezi nejlepšími bankami spolu s Českou spořitelnou a Komerční bankou. Malé bankovní domy se těžko porovnávají, protože mají v krajích většinou velmi málo poboček. Může být ale zklamáním, že například Air Bank a Equa bank, které můžeme často vidět v nákupních centrech, jsou až mezi posledními bankami v této analýze. Ostatně ve finálním modelu nejsou proměnné, které by zvýhodňovaly lokality v nákupních centrech.
V několika krajích je konkurence velmi vyrovnaná, mezi takové kraje patří například
Libe-recký kraj a Středočeský kraj. Ale také jsou zde kraje, kde rozdíly jsou markantní, například se jedná o Plzeňský, Jihomoravský a Jihočeský kraj a Prahu. Banky, které v těchto krajích ztrácejí, by zajisté měli začít s optimalizací sítě právě zde. Kraje s malými relativními rozdíly nabízí pravděpodobně mnohem méně prostoru pro zlepšení výkonnosti pomocí úprav stávající sítě.
3.17 Optimalizace pobočkové sítě UniCredit v Praze
Příklad optimalizace pobočkové sítě je ukázán na pobočkové síti banky UniCredit v Praze.
Jako podklad slouží predikce, které jsme použili i k sestavení krajských analýz. Ze všech poboček v Praze vybereme takovou množinu, která bude nejlepší z hlediska účelové funkce modelu, který je představen ke konci první kapitoly, viz model 1.44. Model maximalizuje celkovou výkonnost pobočkové sítě v dané oblasti. Celková výkonnost je specifikována jako suma výkonností poboček, která je penalizována v případě, že jsou pobočky příliš blízko.
V modelu je třeba specifikovat parametry κ a ρ. První parametr odkazuje na penalizační funkci. Pokud jsou pobočky pod hranicíκ, potom je účelová funkce penalizována. Hodnotu parametru jsme postupně navyšovali od 500 metrů po 2500 metrů. Jako vhodná hodnota se dle grafického zobrazení v mapě jeví 1500 metrů. Standardně by ideální hodnotu volil zadavatel. Dle zvolené hodnoty může ovlivnit výsledek analýzy. Druhý parametr je počtem poboček, který chceme vybrat. Protože byla zvolena banka UniCredit, která má čtrnáct poboček, ponecháme i parametr ρ na stejné úrovni. Říkáme tím, že chceme udržet stejný počet poboček. Za poslední roky většina bank snižuje počet poboček, pokud by zadavatel cílil na nižší počet poboček, pouze bychom poupravili hodnotuρ.
Na obrázku 3.16 vidíme mapu středu Prahy. Modře jsou zachyceny všechny pobočky deseti největších bank. Červeně jsou zachyceny stávající pobočky banky UniCredit, kterou se sna-žíme optimalizovat. Na mapě není zachyceno všech čtrnáct poboček, protože některé jsou více vzdálené od centra. Případné oddálení mapy by znepřehlednilo situaci. Zeleně je návrh optimalizačního modelu. Mezi červenými a zelenými kruhy jsou místy minimální rozdíly. Na-příklad pobočka na Náměstí republiky je odhadnuta i modelem, podobně je tomu u lokality Anděl, Dejvická, Flora, Karlín a Vinohrady. Model navrhuje spíše lokalitu Václavské náměstí místo stávající pobočky v lokalitě Jungmanova. V dalších odhadech se již model se skuteč-ností liší více. Model doporučuje lokality Pražského povstání, Nám. Bratří Synků, Holešovice a dvě pozice v části Žižkov. Stávající dvě pozice u lokalit Budějovická a Brumlovka model nedoporučuje, penalizační funkce nevybrala takto dvě blízké pobočky, navíc již vzdálené od centra města. Stejně tak model nedoporučuje další stávající lokality v ulici Vršovická, u metra Hůrka a v Horních Počernicích. Poloměry u modrých kruhů v těchto lokalitách jsou značně menší, než v centru města, to značí na nižší predikovanou výkonnost. Celková predikovaná výkonnost aktuální sítě UniCredit v Praze je na úrovni 51.6, optimalizovaná úroveň je 62.2.
Nejslabší aktuální lokality banky jsou Horní Počernice, Kobylisy a Hůrka. Banka UniCredit může nejvíce posílit svoji pozici v Praze realokací těchto tří poboček.
Obrázek 3.16: Odhad ideálního rozmístění poboček v Praze zeleně, stávající rozmístění UniCredit červeně a ostatní pobočky bank modře (vlastní zpracování)
Závěr
Tato práce sleduje dva hlavní cíle. Prvním cílem je implementace modelů na základě inter-ních a exterinter-ních dat, které mohou pomoci odpovědět na otázku atraktivity lokalit a otázku porovnání s konkurencí. Druhým cílem je analyzovat pobočkové sítě bankovních domů. K těmto cílům bylo přistoupeno s myšlenkou, že body zájmu a jiná data, která se váží k dané lokalitě, nesou potřebné informace o atraktivitě. Tyto informace jsme se rozhodli zpracovat pomocí regresních modelů, kterým je věnována velká část první kapitoly. Jsou zde předsta-veny klasické předpoklady a statistické vlastnosti regresních modelů, křížová validace, best subset selection regrese a další aspekty modelování, které jsou potřebné pro zajištění dob-rých predikčních vlastností. Malou sekci v rámci první kapitoly zaujímají modely lineárního programování, které rozšiřují využití výsledků z regresního modelu.
Modelová část postupně provádí celým procesem tak, aby všechny důležité aspekty byly vy-světleny a výsledný dvoustupňový model byl pochopen. Po popisu externích a interních dat byla vybrána vysvětlující proměnná modelu na základě korelační analýzy, protože nejvhod-nější proměnná počtu návštěv pobočky je dostupná pouze pro omezený počet pozorování.
Následně je představen koncept takzvané vzdálenostní funkce, což je zjednodušeně funkce, která váží počty bodů zájmu v závislosti na vzdálenosti od pobočky. Funkce obsahuje vzdá-lenostní parametr, který je pro každý typ POI odhadnut v rámci prvního stupně modelu. Do druhého stupně modelu již spadají vysvětlující proměnné dle typu POI s předem odhadnu-tým vzdálenostním parametrem. Modely aspirující na výsledný model jsou získány pomocí best subset selection regrese, kdy se optimalizují tři informační kritéria. Výsledný model vze-šel z těchto modelů po standardním zhodnocení ekonometrických vlastností modelů a dle předpovědních schopností, které jsou otestovány pomocí křížová validace. Vzhledem k počtu pozorování a použitým datům lze model považovat za úspěšný, neboť model vysvětluje přes polovinu variability vysvětlované proměnné a chybovost mimo vzorek je na úrovni, která dovoluje model použít k dalším analýzám.
V třetí kapitole je představena analýza pobočkových sítí, která využívá predikcí modelu na ostatní bankovní domy. V analýze využíváme grafického a tabulkového zachycení hodnot, metrikou srovnání je kumulativní očekávaná výkonnost. Porovnáváme deset největších ban-kovních sítí v České republice dle počtu poboček. Nejprve je představeno celorepublikové srovnání a poté srovnání napříč všemi kraji. Analýza odkrývá, že mezi bankovními sítěmi, které jsou podobné velikosti, jsou systematické rozdíly. Například z trojice ČSOB, Raiffei-senbank a MONETA Money Bank jsou první dvě konkurenční banky pravidelně mezi nejlep-šími bankovními domy dané lokality a naopak MONETA Money Bank bývá pravidelně mezi podprůměrnými bankami, což ukazuje na efektivitu rozmístění poboček prvních dvou bank, případně neefektivitu poslední jmenované. Analýza také ukazuje, že v některých krajích jsou relativní rozdíly v kumulativní výkonnosti velmi vysoké (nad třicet procent) a v jiných krajích jsou tyto rozdíly v řádu procent. V závěru třetí kapitoly je zobrazen návrh na optimalizaci pobočkové sítě jedné z bank pomocí modelu lineárního programování. Tato malá podkapitola
není středobodem práce, ale ukazuje, že výsledky z regresní analýzy můžeme nadále použít například v modelech operačního výzkumu a tím zvýšit využitelnost výsledků.
Oba dva cíle práce se podařilo naplnit, regresní model využívá informací v okolí poboček, vysvětlovací schopnosti modelu jsou adekvátní zamýšlenému použití a model dokáže s určitou mírou přesnosti odpovědět na atraktivitu lokality. Predikce modelu v analýze pobočkových sítí dokázaly zachytit systematické odlišnosti sítí a porovnat výkonnost napříč konkurencí.
V různých částech práce se dá pokračovat alternativně a využít jiného statistického a eko-nometrického aparátu, představený postup je postupem šitým na míru zadání a časovým požadavkům a dalším omezením dle zadavatele. V příloze B.1 jsou přiloženy některé vybrané kódy, které může čtenář použít, čímž je zvýšena užitečnost a přínosnost práce.
Seznam použité literatury
AKAIKE, Hirotogu, 1998. Information Theory and an Extension of the Maximum Likelihood Principle. Springer Series in Statistics (Perspectives in Statistics).
ANH, Ly; DONG, Le Si; KREINOVICH, Vladik; THACH, Nquyen Ngoc, 2018.Econometrics for Financial Applications. Ed. KACPRZYK, Janusz. Springer. isbn978-3-319-73149-0.
Databáze demografických údajů za obce ČR, 2021. Dostupné také z:https://www.czso.cz/
csu/czso/databaze-demografickych-udaju-za-obce-cr.
DAVIDSON, Russell; MACKINNON, James G., 2009. Econometric Theory and Methods. Oxford University Press.isbn0195391055.
DIEBOLD, Francis X., 2006.Elements of Forecasting. 4. vyd. Thomson South-Western.isbn 978-0-324-32359-7.
DOLEŽAL, Jan; KOL., 2016.Projektový management. Grada. isbn978-80-247-5620-2.
DUAN, Naihua, 1983. Smearing Estimate: A Nonparametric Retransformation Method. Jour-nal of the American Statistical Association.
FIALA, Petr, 2004.Projektové řízení: modely, metody, analýzy. Professional Publishing.isbn 9788086419244.
GÉRON, Aurélion, 2017. Hands-On Machine Learning with Scikit-Learn & TensorFlow. O’Reilly. isbn978-1-491-96229-9.
GREENE, William H., 2019.Econometric analysis. 8. vyd. Pearson. isbn9781292231136.
HEUMANN, Christian; SHALABH, Michael Schomaker, 2016.Introduction to Statistics and Data Analysis. Springer.isbn978-3-319-46162-5.
JABLONSKÝ, Josef; LAGOVÁ, Milada, 2014. Lineární modely. Oeconomica. isbn 978-80-245-2020-9.
LUENBERGER, David G.; YE, Yinyu, 2008.Linear and Nonlinear Programming. Ed. HIL-LIER, Frederick S. Springer Science + Business Media, LLC.isbn 978-0-387-74503-9.
RASIEL, Ethan; FRIGA, Paul N., 2001. The McKinsey Mind. 1. vyd. McGraw-Hill. isbn 978-0071374293.
SELVAMUTHU, Dharmaraja; DAS, Dipayan, 2018.Introduction to Statistical Methods, De-sign of Experiments and Statistical Quality Control. Springer.isbn 978-981-13-1736-1.
UNPINGCO, José, 2016.Python for Probability, Statistics, and Machine Learning. Springer.
isbn978-3-319-30717-6. issn978-3-319-30717-6.
WOOLDRIDGE, Jeffrey M., 2012. Introductory Econometrics. 5. vyd. Cengage Learning.
isbn978-1-111-53104-1.
YANG, Yuhong, 2005. Can the strengths of AIC and BIC be shared? A conflict between model indentification and regression estimation. Biometrika. Dostupné také z: https : //academic.oup.com/biomet/article/92/4/937/389439.
Základní sídelní jednotka, 2021. Dostupné také z:https://www.czso.cz/csu/rso/zsj_rso.
Přílohy
A. Výstupy modelové části
(a) Banky a bankomaty (b) Doprava (c) Nakupování
(d) Rezidence (e) Stravování (f) Ubytování
(g) Úřady a kanceláře (h) Volný čas (i) Vzdělání
(j) Zdravotnictví
Obrázek A.1: Vysvětlená adjustovaná variabilita modelu dle přidané proměnné a vzdálenosti, přidané vysvětlující proměnné jsou nezlogaritmované (vlastní zpracování)
(a) Banky a bankomaty (b) Doprava (c) Nakupování
(d) Rezidence (e) Stravování (f) Ubytování
(g) Úřady a kanceláře (h) Volný čas (i) Vzdělání
(j) Zdravotnictví
Obrázek A.2: Vysvětlená adjustovaná variabilita modelu dle přidané proměnné a vzdálenosti, přidané vysvětlující proměnné jsou zlogaritmované (vlastní zpracování)
Tabulka A.1: Hodnoty nejlepších parametrů vzdálenostní funkce pro jednotlivé proměnnéj, přidané proměnné zlogaritmované (vlastní zpracování)
Model log(produkce) dmax,j R2Adj Pj
β0+β1log(w(POIdmax)) +β2log(populace) 3250 0.428 0.104
Tabulka A.2: Model best subset selection dle R2Adj, AIC i BIC s konstantní dmax = 3000 metrů (vlastní zpracování)
Dep. Variable: log_produkce R-squared: 0.569
Model: OLS Adj. R-squared: 0.552
Method: Least Squares F-statistic: 33.85 Date: Thu, 18 Nov 2021 Prob (F-statistic): 7.64e-26
Time: 17:16:34 Log-Likelihood: -45.672
No. Observations: 161 AIC: 105.3
Df Residuals: 154 BIC: 126.9
Df Model: 6
coef std err t P>|t| [0.025 0.975]
Doprava 0.0009 0.000 2.374 0.019 0.000 0.002 Rezidence 0.0001 3.74e-05 3.259 0.001 4.8e-05 0.000 Ubytování -0.0030 0.001 -4.829 0.000 -0.004 -0.002 Volný čas -0.0109 0.004 -3.042 0.003 -0.018 -0.004 Vzdělání 0.0121 0.005 2.365 0.019 0.002 0.022 Úřady a kanceláře 0.0115 0.002 4.848 0.000 0.007 0.016 intercept 11.2036 0.068 163.966 0.000 11.069 11.339
Omnibus: 1.000 Durbin-Watson: 1.318 Prob(Omnibus): 0.606 Jarque-Bera (JB): 0.695
Skew: -0.144 Prob(JB): 0.706
Kurtosis: 3.144 Cond. No. 8.15e+03
Tabulka A.3: Model best subset selection dle R2Adj s variabilnídmax,j (vlastní zpracování) Dep. Variable: log_produkce R-squared: 0.588
Model: OLS Adj. R-squared: 0.569
Method: Least Squares F-statistic: 31.16 Date: Thu, 18 Nov 2021 Prob (F-statistic): 1.61e-26
Time: 18:16:32 Log-Likelihood: -42.045
No. Observations: 161 AIC: 100.1
Df Residuals: 153 BIC: 124.7
Df Model: 7
coef std err t P>|t| [0.025 0.975]
Banky a bankomaty 0.0132 0.005 2.613 0.010 0.003 0.023 Doprava 0.0004 0.000 1.069 0.287 -0.000 0.001 Rezidence 6.87e-05 3.84e-05 1.790 0.075 -7.13e-06 0.000 Volný čas -0.0047 0.003 -1.451 0.149 -0.011 0.002 Vzdělání 0.0141 0.006 2.451 0.015 0.003 0.025 Zdravotnictví -0.0023 0.001 -1.726 0.086 -0.005 0.000 Úřady a kanceláře 0.0118 0.007 1.720 0.087 -0.002 0.025 intercept 11.1820 0.065 172.631 0.000 11.054 11.310
Omnibus: 0.186 Durbin-Watson: 1.341 Prob(Omnibus): 0.911 Jarque-Bera (JB): 0.127
Skew: -0.068 Prob(JB): 0.939
Kurtosis: 2.986 Cond. No. 7.95e+03
Tabulka A.4: Model best subset selection dle AIC s variabilnídmax,j (vlastní zpracování) Dep. Variable: log_produkce R-squared: 0.585
Model: OLS Adj. R-squared: 0.568
Method: Least Squares F-statistic: 36.13 Date: Thu, 18 Nov 2021 Prob (F-statistic): 4.45e-27
Time: 18:14:25 Log-Likelihood: -42.644
No. Observations: 161 AIC: 99.29
Df Residuals: 154 BIC: 120.9
Df Model: 6
coef std err t P>|t| [0.025 0.975]
Banky a bankomaty 0.0138 0.005 2.730 0.007 0.004 0.024 Rezidence 8.114e-05 3.66e-05 2.218 0.028 8.86e-06 0.000 Volný čas -0.0058 0.003 -1.899 0.059 -0.012 0.000 Vzdělání 0.0152 0.006 2.693 0.008 0.004 0.026 Zdravotnictví -0.0019 0.001 -1.517 0.131 -0.004 0.001 Úřady a kanceláře 0.0112 0.007 1.628 0.106 -0.002 0.025 intercept 11.1726 0.064 173.986 0.000 11.046 11.300
Omnibus: 0.144 Durbin-Watson: 1.336 Prob(Omnibus): 0.931 Jarque-Bera (JB): 0.052
Skew: -0.044 Prob(JB): 0.974
Kurtosis: 3.012 Cond. No. 7.86e+03
Tabulka A.5: Model best subset selection dle BIC s variabilnídmax,j (vlastní zpracování) Dep. Variable: log_produkce R-squared: 0.555
Model: OLS Adj. R-squared: 0.550
Method: Least Squares F-statistic: 98.58 Date: Thu, 18 Nov 2021 Prob (F-statistic): 1.62e-28
Time: 18:10:16 Log-Likelihood: -48.169
No. Observations: 161 AIC: 102.3
Df Residuals: 158 BIC: 111.6
Df Model: 2
coef std err t P>|t| [0.025 0.975]
Banky a bankomaty 0.0170 0.003 5.820 0.000 0.011 0.023 Rezidence 0.0001 2.65e-05 4.695 0.000 7.2e-05 0.000 intercept 11.2162 0.058 194.972 0.000 11.103 11.330
Omnibus: 1.874 Durbin-Watson: 1.340 Prob(Omnibus): 0.392 Jarque-Bera (JB): 1.904
Skew: -0.254 Prob(JB): 0.386
Kurtosis: 2.841 Cond. No. 6.89e+03
Tabulka A.6: Model best subset selection dleR2Adj a AIC s konstantní dmax = 3000 metrů (vlastní zpracování)
Dep. Variable: log_produkce R-squared: 0.541
Model: OLS Adj. R-squared: 0.526
Method: Least Squares F-statistic: 36.51 Date: Thu, 18 Nov 2021 Prob (F-statistic): 1.35e-24
Time: 19:00:25 Log-Likelihood: -50.721
No. Observations: 161 AIC: 113.4
Df Residuals: 155 BIC: 131.9
Df Model: 5
coef std err t P>|t| [0.025 0.975]
Banky a bankomatylog 0.2224 0.111 2.010 0.046 0.004 0.441 Stravovánílog -0.0471 0.028 -1.662 0.099 -0.103 0.009 Ubytovánílog 0.1168 0.072 1.623 0.107 -0.025 0.259 Zdravotnictvílog -0.1272 0.079 -1.618 0.108 -0.282 0.028 Úřady a kancelářelog 0.4327 0.109 3.967 0.000 0.217 0.648 intercept 10.6089 0.133 79.588 0.000 10.346 10.872
Omnibus: 2.234 Durbin-Watson: 1.241 Prob(Omnibus): 0.327 Jarque-Bera (JB): 1.787
Skew: -0.221 Prob(JB): 0.409
Kurtosis: 3.267 Cond. No. 39.4
Tabulka A.7: Model best subset selection dle BIC s konstantnídmax = 3000 metrů, zlogarit-mované proměnné (vlastní zpracování)
Dep. Variable: log_produkce R-squared: 0.507
Model: OLS Adj. R-squared: 0.503
Method: Least Squares F-statistic: 163.2 Date: Thu, 18 Nov 2021 Prob (F-statistic): 3.63e-26
Time: 19:10:39 Log-Likelihood: -56.516
No. Observations: 161 AIC: 117.0
Df Residuals: 159 BIC: 123.2
Df Model: 1
coef std err t P>|t| [0.025 0.975]
Úřady a kancelářelog 0.4867 0.038 12.775 0.000 0.411 0.562 intercept 10.4725 0.115 90.829 0.000 10.245 10.700
Omnibus: 1.551 Durbin-Watson: 1.155 Prob(Omnibus): 0.460 Jarque-Bera (JB): 1.208
Skew: -0.016 Prob(JB): 0.547
Kurtosis: 3.423 Cond. No. 14.1
Tabulka A.8: Model best subset selection dleR2Adj s variabilní dmax,j, zlogaritmované pro-měnné (vlastní zpracování)
Dep. Variable: log_produkce R-squared: 0.557
Model: OLS Adj. R-squared: 0.539
Method: Least Squares F-statistic: 32.22 Date: Thu, 18 Nov 2021 Prob (F-statistic): 6.17e-25
Time: 20:54:08 Log-Likelihood: -47.900
No. Observations: 161 AIC: 109.8
Df Residuals: 154 BIC: 131.4
Df Model: 6
coef std err t P>|t| [0.025 0.975]
log_pop -0.0404 0.038 -1.062 0.290 -0.116 0.035 Banky a bankomatylog 0.1848 0.126 1.464 0.145 -0.065 0.434 Ubytovánílog 0.0569 0.029 1.956 0.052 -0.001 0.114 Vzdělánílog 0.2645 0.103 2.560 0.011 0.060 0.469 Zdravotnictvílog -0.2150 0.080 -2.696 0.008 -0.373 -0.057 Úřady a kancelářelog 0.3249 0.109 2.988 0.003 0.110 0.540 intercept 10.8196 0.264 40.973 0.000 10.298 11.341
Omnibus: 2.845 Durbin-Watson: 1.221 Prob(Omnibus): 0.241 Jarque-Bera (JB): 2.846
Skew: -0.318 Prob(JB): 0.241
Kurtosis: 2.858 Cond. No. 133.
Tabulka A.9: Model best subset selection dle BIC s variabilní dmax,j, zlogaritmované pro-měnné (vlastní zpracování)
Dep. Variable: log_produkce R-squared: 0.525
Model: OLS Adj. R-squared: 0.519
Method: Least Squares F-statistic: 87.49 Date: Thu, 18 Nov 2021 Prob (F-statistic): 2.65e-26
Time: 21:01:07 Log-Likelihood: -53.362
No. Observations: 161 AIC: 112.7
Df Residuals: 158 BIC: 122.0
Df Model: 2
coef std err t P>|t| [0.025 0.975]
Vzdělánílog 0.1680 0.067 2.513 0.013 0.036 0.300 Úřady a kancelářelog 0.3322 0.072 4.611 0.000 0.190 0.474 intercept 10.4165 0.116 90.123 0.000 10.188 10.645
Omnibus: 1.854 Durbin-Watson: 1.172 Prob(Omnibus): 0.396 Jarque-Bera (JB): 1.688
Skew: -0.251 Prob(JB): 0.430
Kurtosis: 3.000 Cond. No. 19.8
B. Vybrané kódy z výpočtů
Listing B.1: Kód vytvoření grafů ke vzdálenostním funkcím; best subset selection regrese;
křížová validace; optimalizační problém MIP
" " "
Vytvoreni g r a f u ke vzdalenostnim funkcim
" " "
r_squared_adj . append ( model . rsquared_adj ) d i s t a n c e . append (max_d)
" " "
metric_value = r e g r . rsquared_adj e l i f metric == ’AIC ’ :
metric_value = r e g r . a i c e l i f metric == ’BIC ’ :
metric_value = r e g r . b i c
e l s e: print( ’ metric : ␣ use ␣ rsquared_adj , ␣AIC␣ or ␣BIC ’ ) return { " model " : regr , metric : metric_value }
def getBest ( k , metric ) :
models_best = pd . DataFrame ( columns =[ metric , " model " ] )
print( models_best . model [ 6 ] . summary ( ) ) # R2squared ADJ, otocena promenna log_pop
" " "
Optimalizace pobockove s i t e v Praze
" " "
# Import PuLP modeler f u n c t i o n s from pulp import ∗
# Create the ’ prob ’ v a r i a b l e to contain the problem data prob = LpProblem ( " PragueAlocationProblem " , LpMaximize )
" " "
" Total ␣ performance , ␣ adjusted "
)
lpSum ( [ x_i [ i ] f o r i in Locations ] ) <= rho ,
"Number␣ o f ␣ branches "
)