• Nebyly nalezeny žádné výsledky

Obrazová a audiovizuální data

1.3 Ochrana osobních údajů online

2.1.3 Obrazová a audiovizuální data

Audiovizuální data jsou v době sociálních médií často sdílena na internetu. Může se jed-nat o obrazové materiály jako fotky a videa nahrané uživatelem, ale také data z webkamer.

Analýzou prochází osoby na fotografii (rozpoznání obličeje a rysů), okolí i předměty. Mnoho aplikací nabízí filtry, které snímají a analyzují pohyby obličeje tak, aby se mohly přizpůsobit uživateli. Aplikace také mohou vyžadovat přístup k celé knihovně fotografií a videí na uživa-telském zařízení. Na obrázku níže lze vidět pět aplikací a jejich přístup k obrazovým a audio datům. Všechny mají přístup k technologii rozpoznávání obličeje, rozpoznávání okolí a osob ve vašem okolí, případně propojení s jejich identitou, knihovně fotografií a jazyku zařízení.

Technologie rozpoznávání obličeje je založená na analýze rysů obličeje. Obraz obličeje je roz-dělen na dimenzionální body, které odpovídají velikosti obrazu v pixelech. (Slynchuk, 2021;

Oravec, 2010)

Obrázek 2.1: Přístup aplikací k audiovizuálním datům, zdroj: (Slynchuk, 2021) 2.1.4 Data o propojených aplikacích

Aplikace třetích stran mohou získat přístup k datům prostřednictvím sdíleného přihlášení.

Mnoho webů a aplikací disponuje možností zaregistrovat se prostřednictvím již existujícího účtu jiné společnosti jako například Google nebo Facebook. Uživatel je pak vyzván k souhlasu se sdílením konkrétních informací mezi aplikacemi. Může se jednat o přístup k profilu, tedy jméno a příjmení, případně email a telefonní číslo, seznamu kontaktů nebo galerii. Co se prodeje či sdílení údajů mezi třetími stranami týče, mělo by se jednat o data anonymizovaná.

Data jsou sdílena také mezi aplikacemi řízenými mateřskou organizací. Příkladem může být Facebook, Instagram a Snapchat.

2.1.5 Údaje o zařízení

Mezi údaje o zařízení patří operační systém, typ zařízení, rozlišení obrazu, typ prohlížeče a jeho nastavení, síťové nastavení a jeho poskytovatel, IP adresa, informace o chybách a také nainstalované aplikace. Některé společnosti mohou mít přístup i ke stavu baterie, síle mobilního signálu, kapacitě paměti zařízení a jeho zaplněnosti a verzi operačního systému a aplikací. Sdílení těchto dat se děje pravidelně například mezi společností Google a zařízeními se systémem Android, na kterém jsou nainstalovány aplikace poskytovány platformou Google Play Store. (Google, 2021)

2.1.6 Senzorová data

S rozvojem technologií se stále více využívá sběr senzorových dat (anglicky sensor data), což jsou výstupy zařízení, které detekuje a reaguje na určitý typ vstupu z fyzického prostředí.

Výstup může poskytovat informace dalšímu systému nebo působit jako nový vstup. Může se jednat například o data ze systému chytré domácnosti, chytrých hodinek nebo dalších nosi-telných elektronických zařízení, takzvaných wearables. Senzorová data jsou obecně spojována s pojmem Internet věcí. (Wigmore, 2015)

Zatím není právně klasifikováno, jak by se s těmito informacemi mělo nakládat, ačkoli jsou tyto údaje již využívány jako zdroj pro vývoj inteligentních obchodních modelů. Na základě dat ze senzorů lze sledovat vzorce chování uživatele a dále je využít k predikci budoucí aktivity.

možnosti zpracování. Senzorová data jsou shromažďována prostřednictvím bran (gateways), které slouží jako překladač mezi ethernetem či jiným protokolem a rozhraním zařízení se senzorem. (Burdon, 2020)

2.2 Technologie sběru dat

2.2.1 Cookies

Mimo prohlížeče i samotné webové stránky ukládají chování uživatele prostřednictvím coo-kies. Jedná se o textový soubor, který zaznamenává chování uživatele na webu a při jeho další návštěvě slouží jako identifikátor. Cookies mají dva hlavní účely, a to autentizaci a sledování.

Autentizační cookies ukládají přihlášení uživatele, tedy kde je přihlášen a pod jakým jménem.

Cookies sloužící ke sledování se využívají při cílení personalizovaného a marketingového ob-sahu. Speciálním typem cookies jsou session cookies (relační cookies), které se využívají pouze při pohybu na webové stránce, ukládají se do RAM a po skončení relace jsou automaticky smazány. (Kaspersky, 2021)

2.2.2 Pixelové značky

Pixelová značka je průhledný jeden pixel velký obrázek umístěný na webu či jako součást HTML e-mailu. Tato značka slouží k měření aktivity na daném webu nebo při prohlížení e-mailu. Používá se v kombinaci s cookies pro měření imprese příspěvků, záznamu stažení souboru nebo při měření výkonu reklamního obsahu. Při použití v e-mailu mohou odesílatele informovat o přečtení příjemcem. (iapp, 2021)

2.2.3 Dotazníky

Společnosti mohou získávat data zasíláním dotazníků. Častým příkladem jsou dotazníky spo-kojenosti po zakoupení zboží nebo dotazníky ohledně reakce na zobrazované reklamy. Dotaz-níky jsou zasílány na e-mail uživatele po provedení nákupu v e-shopu nebo přímo v nákupní aplikaci. Často obsahují obecné otázky o spokojenosti s nákupem, dopravou nebo zákaznic-kým servisem, ale i otázky ohledně nakoupeného zboží. U oblečení to může být velikost, střih či barva, u ostatního zboží pak kvalita nebo dodací termín. Internetoví obchodníci také využívají otázku, zda by uživatel doporučil web přátelům.

2.2.4 Data třetích stran

Většina webových stránek a mobilních aplikací sdílí údaje o uživatelích s dalšími společnostmi, což označujeme jako data třetí strany, tedy data získaná mimo web či aplikaci provozovatele.

Příkladem může být facebookové tlačítko To se mi líbí pod novinovým článkem nebo YouTube video vložené na webu. Společnosti Google a Facebook sledují své uživatele na více než 100 000 webových stránkách. Studie z roku 2015 ukázala, že 85 až 95 % bezplatných aplikací a 60 % placených aplikací sdílí data s třetími stranami. (Christl, 2017)

2.3 Ochrana

Uživatelé jsou při pohybu na webu podrobeni neustálému sledování a proto existují ochranná opatření, která sběru dat částečně zamezují. Jedná se jak o technologická řešení, tak o vzdě-lávání uživatelů. Legislativní ochrana je blíže popsána v kapitole 1. Mezi vlastnosti technolo-gických nástrojů pro zabránění sledování patří detekce a blokace třetích stran. Uživatel může zvolit automatické mazání cookies, zobrazit na základě čeho byla reklama cílena nebo se z personalizace obsahu odhlásit. Jako opatření lze vnímat i edukaci uživatelů o tom, jaké in-formace jsou o nich shromažďovány, a jak je s nimi dále nakládáno. Cílem je transparentnost a kontrola nad osobními daty uživatele. (Alwazir, 2019)

2.3.1 VPN

VPN neboli virtuální privátní síť nabízí šifrování připojení a veškeré komunikace mezi uži-vatelem a sítí. VPN přiřazuje uživateli při každém připojení novou IP adresu, a tudíž zne-snadňuje jeho identifikaci a tedy i sběr informací a cílení reklamního obsahu. I při používání VPN prohlížeč stále může ukládat soubory cookies, jejichž sběr musí uživatel pro zajištění soukromí vypnout manuálně. Nevýhodou VPN může být zpomalení připojení a nezaručená kvalita služby. (Empey, 2019)

Obrázek 2.2: Fungování VPN, zdroj: (Surfshark, 2021

VPN zvyšuje online soukromí, veškeré informace uživatele ale neochrání. V tabulce níže jsou shrnuty typy informací a jejich anonymizace zajištěná VPN. Jsou v ní popsány typy informací, které dokáže VPN skrýt a které jsou sledovatelné i přes změnu IP adresy.

Tabulka 2.1: Skryté údaje, zdroj: autorka na základě (Surfshark, 2021)

Informace o kartě (při nákupu) viditelné viditelné Vyhledávání po přihlášení na Google viditelné viditelné Informace sdílené na sociálních médiích viditelné viditelné

Cílené reklamy omezené velmi časté

2.3.2 Proxy

Proxy server slouží jako překladač mezi sítí a protokoly. Koncový uživatel je tedy od cílové stránky tímto serverem oddělen a prochází přes něj veškerá komunikace. Stejně jako u VPN, uživatel připojený k anonymnímu proxy serveru získává novou IP adresu a přenášená data jsou šifrována. Existují také transparentní proxy, které cílovému webu předávají IP adresu uživatele a tím i odhalují jeho totožnost. Zvláštním typem jsou pak vysoce anonymní proxy servery, které IP adresy mění v průběhu připojení. (Petters, 2021)

2.3.3 Anonymní prohlížeč

Běžně dostupné internetové prohlížeče nabízí možnost anonymního režimu. Prohlížeč ne-ukládá historii navštívených stránek, informace o stahovaných souborech ani hesla či jiné informace z formulářů, u kterých je možnost automatického vyplnění. Prohlížeč může v ano-nymním režimu žádat stránky, aby neukládali soubory cookies. Například v Google Chrome se jedná o funkci Do Not Track a v Safari Bránit ve sledování. Slouží primárně k zabrá-nění ukládání informací na daném zařízení. Anonymní prohlížeč naopak nezajistí, že stránky neukládají informace o aktivitě uživatele a nezabrání přístupu poskytovatele internetových služeb k těmto informacím. (Sekal, 2020)

Dále existují specializované prohlížeče, které zachovávají anonymitu uživatele i ve standard-ním režimu. Tyto prohlížeče neukládají IP adresy ani historii navštívených stránek a auto-maticky omezují používání souborů cookies na nezbytně nutnou míru.

2.3.4 Volby sledování aplikací

Společnost Apple vložila do aktualizace operačního systému iOS 14.5 framework (rámec) App Tracking Transparency (Transparentnost aplikací při sledování). Tento framework musí být nově součástí všech aplikací z oficiálního obchodu s aplikacemi (App Store). Hlavním účelem

je vyžádání povolení pro sledování napříč aplikacemi a weby třetích stran. Nejedná se tedy o ochranu při pohybu v aplikaci, ale při interakci s dalšími aplikacemi a weby jiných vydavatelů.

(Cross, 2021)

3. Zpracování dat

Pojem Big Data se stal univerzální frází pro aplikace, které zahrnují velmi velké množství (osobních) dat, které jsou analyzovány, aby se z nich odvodily znalosti, a poté se používají k cílení na jednotlivce či skupiny nebo k obecnému rozhodování na základě znalostí. Velká data lze tedy považovat za proces skládající se ze tří fází: akvizice, analýza dat a aplikace znalostí. (Oostven, 2016)

Obrázek 3.1: Proces Big data, zdroj: (Oostven, 2016)

Obsahem první fáze je sběr osobních dat. Subjekty je mohou poskytovat přímo prostřednic-tvím zadání do uživatelského profilu nebo na danou síť. Další možností je vytváření nových dat za pomoci propojení stávajících informací o subjektu se vzorci chování a dalšími daty.

Osobní data se dají také získat nákupem od třetí strany, která se zabývá sběrem dat za účelem jejich prodeje. Během analýzy pak s využitím pravděpodobnosti dochází k vytváření modelů a predikcí budoucího chování. V této fázi se využívá technologie strojové učení. V poslední fázi, tedy aplikování znalostí získaných analýzou dat, je na základě modelů a predikcí vytvořen algoritmus, který uživateli například nabízí marketingový obsah nebo ho zařazuje do kategorie výše úroku na úvěru banky. (Bakhoum, 2018)

Rozhodování na základě algoritmů a s tím spojené možnosti kategorizace lidí může vést ke skryté diskriminaci. Například využití lokalizačních dat při takzvaném Redliningu (odepření služeb ve specifické oblasti) může vést k diskriminaci na základě etnicity pro skupiny osob žijících v této oblasti. Běžné informace, jako značka auta, mohou korelovat s citlivými daty, jako náboženské či politické vyznání, nebo právě rasová či etnická příslušnost. (Bakhoum, 2018)

Co vše lze dle uživatelského chování předpovědět, a s jakou přesností, ukazuje informační grafika níže. V grafu na pravé straně lze vidět, že citlivé osobní údaje, které jinak podléhají přísnější formě zpracování než ostatní údaje, lze odhadnout z facebookových interakcí pomocí tlačítka Líbí se mi s minimální přesností 60 %. Povahové znaky lze odhadnout s přibližně 70%

přesností a u poznávání emocí uživatele se přesnost pohybuje kolem 80%. K těmto odhadům lze dojít i na základě návštěvnosti webových stránek, ze záznamů mobilních hovorů nebo pomocí údajů z mobilních aplikací. (Christl, 2017)

Obrázek 3.2: Odhad dat z uživatelského chování a jejich přesnost, zdroj: (Christl, 2017) Finanční start-upy využívají uživatelská data pro výpočet bonity klientů. Společnosti jako MasterCard či Telefonica s těmito společnostmi spolupracují a tato spolupráce se může pro-mítat i do online marketingu. Příkladem může být cílení reklamy na sociální síti Twitter na základě bonity uživatele, postavené na datech získaných prostřednictvím datového brokera Oracle. (Christl, 2017)

3.1 Strojové učení a umělá inteligence

Strojové učení jsou mechanismy, díky kterým je počítač schopen se učit na základě příkladů nebo zkušeností. Během učení se zvyšuje systémová výkonnost. Zlepšující se technologické možnosti a vysoká výpočetní kapacita dovolují provádění náročných statistických a matema-tických výpočtů, na kterých jsou postaveny inteligentní analytické systémy. Příklady využití strojového učení může být vyhledávání duplicitních inzerátů na trhu s nemovitostmi, chatbot poskytující automatické odpovědi ze znalostní báze nebo při predikci chování uživatele na základě posloupnosti navštívených URL adres. Součástí strojového učení je takzvané hloub-kové učení, které dokáže zpracovávat více datových vrstev současně a tvořit vrstvy nové. Tyto vrstvy slouží jako podklad k prediktivní analýze. Hloubkové učení rozšiřuje znalost o vztazích mezi daty. Analytické nástroje založené na strojovém učení poskytují rychlé rozhodování a odebírají z rozhodovacího procesu subjektivní faktory, jako osobní preference, názory a pocity,

dále automatizují rutinní činnosti, snižují chybovost a objevují skryté souvislosti v datech.

(Evans, 2019)

Umělou inteligence lze používat ve všech fázích online marketingu. Může sloužit k tvorbě prognóz, optimalizaci nebo vyhledávání a opravě chyb. Mezi populární řešení zavedení umělé inteligence v digitálním marketingu patří neuronové sítě, fuzzy logika a expertní systémy.

Důsledkem je adaptivní, flexibilní a interaktivní proces přizpůsobený uživatelským zájmům a potřebám. Příkladem využití umělé inteligence je vytvoření adaptivních scénářů reagujících v čase na uživatelskou zpětnou vazbu. Obsah přístupný na webu je tvořen z elementů jako text, video, audio nebo prvek umožňující vytvoření zpětné vazby. Tím je myšlen například komentář, označení To se mi líbí/nelíbí nebo hodnocení pomocí hvězdiček. Na tyto prvky je napojen kontrolní mechanismus, který snímá jejich hodnoty na základě modelu umělé neuronové sítě a definuje konečný bod scénáře. Konečný bod pak rozhoduje jakému uživateli, případně jak často se takový scénář zobrazí. (Kose, 2017)

3.2 Platformy

3.2.1 Google

Google vlastní nejpoužívanější webový prohlížeč, vyhledávač i mobilní platformu, což ho dělá největší digitální reklamní společností na světě. Google mapy, Gmail a Youtube navštíví více než miliarda uživatelů každý měsíc. S neustále se vylepšujícími technologiemi sběru dat a cílení obsahu se tržby společnosti zvyšují.

Google shromažďuje jak aktivní data, tedy data, která uživatel platformě vědomě poskytuje při registraci, tak data pasivní. Tyto data pocházejí z platforem (například Android), propo-jených aplikací (Google mapy, YouTube) a marketingových nástrojů (AdWords, Google ads).

Google ukládá veškerý obsah vytvořený, nahraný a přijatý při využívání služeb.

Během jediného dne pohybu na internetu lze identifikovat uživatelské zájmy na základě loka-lizačních dat, nakoupeného zboží, vyhledávání nebo poslouchané hudby. Pokud uživatel navíc využívá zařízení s operačním systémem Android, připojují se ještě osobní data jako jméno, telefonní číslo, datum narození nebo číslo platební karty a data generovaná při používání aplikací i samotného zařízení. Sem lze zařadit konfiguraci zařízení či jeho historické zálohy.

Odesílání těchto dat se děje na pozadí bez podmínky uživatelské interakce. Výzkum profesora Douglase C. Schmidta z roku 2018 ukázal, že zařízení Android s prohlížečem Chrome během 24 hodin odeslalo lokaci společnosti Google celkem 340krát, což se rovná průměrně 14 sdílení dat za hodinu. (Schmidt, 2018)

Při využívání telefonu Android jsou odesílány data i když nejsou využívány žádné Googlem vlastněné aplikace. Na serverové domény Googlu jsou komunikovány převážně data z reklam-ních platforem jako AdWords a Google Analytics. Na obrázku níže lze vidět jaká data během dne Android pasivně odesílá. Ráno se může jednat o poslech hudby přes Google Play,

lokali-zaci zařízení při cestě do školy či na městskou hromadnou dopravu, čtení zpráv a vyhledávání na internetu. Odpoledne pak uživatel vyhledává prostřednictvím Google Maps místa, kam jít na oběd, používá aplikaci při nákupu odpolední kávy, vytváří události v kalendáři a na-kupuje v lékárně prostřednictvím Google Pay. Večer pak objednává taxi skrz aplikaci Uber, vyhledává hotely na internetu, pouští hudbu a sleduje videa. Během noci píše zprávy a při náhodném probuzení kontroluje telefon. Všechny tyto aktivity generují a odesílají data o chování uživatele. (Schmidt, 2018)

Obrázek 3.3: Pasivní sběr dat telefonu Android během dne, zdroj: (Saxon, 2018) Google na svých stránkách uvádí, že s daty nakládá zodpovědně a chrání soukromí uživatele.

Zmiňuje zde, že chce minimalizovat nakládání s osobními údaji, uložené informace jsou chrá-něny pokročilými technologiemi a zavazuje se, že osobní údaje uživatelů neprodává a chrání je před třetími stranami. Shromažďování údajů odůvodňuje zkvalitňováním služeb jako je ur-čení jazyka nebo zobrazení pro uživatele zajímavého obsahu (jak reklamního, tak například článků či YouTube videí).

Pokud se uživatel pohybuje na platformách vlastněných Googlem nepřihlášený, shromažďo-vané údaje ukládá společnost prostřednictvím jedinečných identifikátorů. Tyto identifikátory ukládá v souborech cookies pro prohlížení webu nebo jako inzertní ID pro poskytování rele-vantního marketingového obsahu. Pokud je uživatel přihlášen, data se shromažďují pod jeho uživatelským účtem a dále se s nimi nakládá jako s osobními údaji. V tomto případě se tedy jedná o všechna data propojená se jménem, e-mailovou adresou nebo fakturačnímu údaji.

(Google, 2021)

Google ve svých zásadách ochrany osobních údajů dělí shromažďované informace do čtyř kategorií. První jsou věci, které uživatel společnosti poskytuje či je vytváří. Patří sem jméno, heslo, telefonní číslo a platební údaje. Dále pak e-maily, fotografie a videa a dokumenty.

Druhou kategorií jsou informace získané při používání služeb, k jejichž sběru dochází při kontaktu služby a serverů. Do této kategorie lze zařadit výše zmíněné unikátní identifikátory, prohlížeč a jeho nastavení, zařízení a jeho nastavení, operační systém, síť a operátor a verze aplikací. Informace v této kategorii mohou pocházet také z komunikace aplikací a prohlížečů se službami Google. Jedná se pak o IP adresu, datum a čas, chybové zprávy a zdrojové URL.

Třetí kategorií je aktivita uživatele. Tyto informace jsou shromažďovány za účelem cílení obsahu. Z aktivity uživatele se ukládají vyhledávání, přehraná videa, interakce s reklamami, informace o zvuku a hlasu, nákupy, komunikace a sdílení obsahu s dalšími uživateli, aktivita u třetích stran využívajících služby Google a historie prohlížeče. (Google, 2021)

Při používání aplikací k telefonním hovorům či posílání zpráv, ukládá Google čísla volajícího a volaného, délku hovoru, datum, čas a e-mailové adresy. Poslední kategorií údajů jsou údaje o poloze. Polohu uživatele Google odhaduje dle údajů z GPS, IP adresy, senzorových dat a informací o blízkých objektech v okolí, jako jsou mobilní vysílače, Bluetooth zařízení a přístupové body wifi. Speciální kategorií jsou pak údaje z veřejně přístupných zdrojů, jako jsou noviny, informace od marketingových a bezpečnostních partnerů společnosti Google a od inzerentů. (Google, 2021)

3.2.2 Facebook

Facebook stejně jako Google sbírá mnoho osobních dat. Velkou část poskytuje společnosti sám uživatel. Jedná se o informace uvedené při registraci, tedy jméno, email, telefonní číslo či datum narození. Dále informace získané při komunikaci s ostatními uživateli prostřednictvím zpráv a vytváření nebo sdílení obsahu. Facebook shromažďuje metadata jako místo a čas pořízení u fotografií a videí nebo datum vytvoření souboru. (Facebook, 2021)

Facebook vlastní několik různých produktů (Facebook, Instagram, Messenger a další) u kte-rých sbírá informace o jejich používání, konkrétně o typu obsahu, frekvenci a délce aktivity.

Pokud uživatel přes Facebook nakoupí ve hře nebo přispěje na charitu jsou ukládána data o transakci jako číslo platební karty, kontaktní a fakturační údaje nebo doprava. (Facebook, 2021)

Podobně jako Google, sbírá společnost Facebook údaje o zařízení, tedy o všech počítačích, mobilních telefonech, televizích a dalších chytrých zařízeních, na kterých se lze připojit k internetu a dochází na nich k interakci s jejich produkty. Dochází tak ke sběru informací o vlastnostech zařízení, tedy operační systém, stav baterie a signálu, velikost úložiště a nain-stalované aplikace. Společnosti jsou poskytovány informace o úkonech prováděných na daném zařízení a pohybu myši. Dále sbírá informace o zařízení s Bluetooth, přístupových wifi bo-dech v okolí, vysílačích mobilního signálu i GPS. Shromažďují se i informace o síti, tedy název operátora, IP adresa, telefonní číslo, rychlost připojení a časová zóna a informace o dalších

zařízeních v okolí. Společnost Facebook využívá dat ze souborů cookies a informace třetích stran. Od třetích stran získává informace o navštívených webech, koupených položkách a

zařízeních v okolí. Společnost Facebook využívá dat ze souborů cookies a informace třetích stran. Od třetích stran získává informace o navštívených webech, koupených položkách a