doc. Ing. Jan Janoušek, Ph.D.
vedoucí katedry doc. RNDr. Ing. Marcel Jiřina, Ph.D.
děkan V Praze dne 7. června 2020
ZADÁNÍ DIPLOMOVÉ PRÁCE
Název: Integrace metody ITO do nástroje ParaCell Student: Bc. Michal Čermák
Vedoucí: doc. Ing. Ivan Šimeček, Ph.D.
Studijní program: Informatika
Studijní obor: Teoretická informatika Katedra: Katedra teoretické informatiky Platnost zadání: Do konce zimního semestru 2021/22
Pokyny pro vypracování
1) Seznamte se základními pojmy a fyzikálními modely v oblasti krystalických látek. Zaměřte se na vlastnosti rentgenového záření ve spojení s metodou práškové difrakce používané pro získání strukturních parametrů zkoumané krystalické látky [1].
2) Nastudujte tzv. přímé metody pro řešení krystalové struktury využívající globální optimalizaci strukturního modelu a kompletního difrakčního obrazu.
3) Nastudujte vnitřní architekturu nástroje ParaCell [2], jehož autorem je vedoucí práce.
4) Navrhněte a implementujte vícevláknový algoritmus pro extrakci reálných mřížkových parametrů z naměřených hodnot obsažených v difrakčním záznamu pomocí metody ITO [3]. Diskutujte vhodnost použití různých datových struktur.
5) Algoritmus otestujte na klastru STAR pro data z volně dostupných vzorků experimentálně naměřených práškovou difrakcí a vyhodnoťte škálovatelnost implementovaného algoritmu.
Seznam odborné literatury
[1] M. Rulf:Algoritmy výpočetní krystalografie DP ČVUT FIT,2014 [2] ParaCell home page https://sourceforge.net/projects/paracell/
[3] J. W. Visser: "A fully automatic program for finding the unit cell from powder data", Journal of Applied Crystallography,vol.2,no.3,p. 89-95, 1969.
Diplomov´ a pr´ ace
Integrace metody ITO do n´ astroje ParaCell
Bc. Michal ˇ Cerm´ ak
Katedra Teoretick´e Informatiky
Vedouc´ı pr´ace: doc. Ing. Ivan ˇSimeˇcek, Ph.D.
27. ˇcervna 2021
Prohl´ aˇ sen´ı
Prohlaˇsuji, ˇze jsem pˇredloˇzenou pr´aci vypracoval samostatnˇe a ˇze jsem uvedl veˇsker´e pouˇzit´e informaˇcn´ı zdroje v souladu s Metodick´ym pokynem o dodrˇzo- v´an´ı etick´ych princip˚u pˇri pˇr´ıpravˇe vysokoˇskolsk´ych z´avˇereˇcn´ych prac´ı.
Beru na vˇedom´ı, ˇze se na moji pr´aci vztahuj´ı pr´ava a povinnosti vypl´yvaj´ıc´ı ze z´akona ˇc. 121/2000 Sb., autorsk´eho z´akona, ve znˇen´ı pozdˇejˇs´ıch pˇredpis˚u.
V souladu s ust.§2373 odst. 2 z´akona ˇc. 89/2012 Sb., obˇcansk´y z´akon´ık, ve znˇen´ı pozdˇejˇs´ıch pˇredpis˚u, t´ımto udˇeluji nev´yhradn´ı opr´avnˇen´ı (licenci) k uˇzit´ı t´eto moj´ı pr´ace, a to vˇcetnˇe vˇsech poˇc´ıtaˇcov´ych program˚u, jeˇz jsou jej´ı souˇc´ast´ı ˇci pˇr´ılohou a veˇsker´e jejich dokumentace (d´ale souhrnnˇe jen ”D´ılo“), a to vˇsem osob´am, kter´e si pˇrej´ı D´ılo uˇz´ıt. Tyto osoby jsou opr´avnˇeny D´ılo uˇz´ıt jak´ymkoli zp˚usobem, kter´y nesniˇzuje hodnotu D´ıla a za jak´ymkoli ´uˇcelem (vˇcetnˇe uˇzit´ı k v´ydˇeleˇcn´ym ´uˇcel˚um). Toto opr´avnˇen´ı je ˇcasovˇe, teritori´alnˇe i mnoˇzstevnˇe neomezen´e. Kaˇzd´a osoba, kter´a vyuˇzije v´yˇse uvedenou licenci, se vˇsak zava- zuje udˇelit ke kaˇzd´emu d´ılu, kter´e vznikne (byt’ jen zˇc´asti) na z´akladˇe D´ıla,
´upravou D´ıla, spojen´ım D´ıla s jin´ym d´ılem, zaˇrazen´ım D´ıla do d´ıla souborn´eho ˇci zpracov´an´ım D´ıla (vˇcetnˇe pˇrekladu) licenci alespoˇn ve v´yˇse uveden´em roz- sahu a z´aroveˇn zpˇr´ıstupnit zdrojov´y k´od takov´eho d´ıla alespoˇn srovnateln´ym zp˚usobem a ve srovnateln´em rozsahu, jako je zpˇr´ıstupnˇen zdrojov´y k´od D´ıla.
V Praze dne 27. ˇcervna 2021 . . .. . .. . .. . .. . .. . .. . .
ˇCesk´e vysok´e uˇcen´ı technick´e v Praze Fakulta informaˇcn´ıch technologi´ı
c
2021 Michal ˇCerm´ak. Vˇsechna pr´ava vyhrazena.
Tato pr´ace vznikla jako ˇskoln´ı d´ılo na ˇCesk´em vysok´em uˇcen´ı technick´em v Praze, Fakultˇe informaˇcn´ıch technologi´ı. Pr´ace je chr´anˇena pr´avn´ımi pˇredpisy a mezin´arodn´ımi ´umluvami o pr´avu autorsk´em a pr´avech souvisej´ıc´ıch s pr´avem autorsk´ym. K jej´ımu uˇzit´ı, s v´yjimkou bez´uplatn´ych z´akonn´ych licenc´ı a nad r´amec opr´avnˇen´ı uveden´ych v Prohl´aˇsen´ı na pˇredchoz´ı stranˇe, je nezbytn´y sou- hlas autora.
Odkaz na tuto pr´aci
ˇCerm´ak, Michal.Integrace metody ITO do n´astroje ParaCell. Diplomov´a pr´ace.
Praha: ˇCesk´e vysok´e uˇcen´ı technick´e v Praze, Fakulta informaˇcn´ıch techno- logi´ı, 2021.
Abstrakt
Tato pr´ace se zab´yv´a zpracov´an´ım dat z´ıskan´ych pomoc´ı metody pr´aˇskov´e difrakce. Konkr´etnˇe se zab´yv´a jednou z metod indexace tˇechto dat, ITO.
Pr´ace obsahuje z´akladn´ı pojmy z oblasti krystalografie a s n´ı spjatou metodou pr´aˇskov´e difrakce. D´ale obsahuje popis metody ITO a tak´e jej´ı implementace do programu ParaCell a v´ysledky jej´ıho testov´an´ı.
Kl´ıˇcov´a slova Krystalografie, Pr´aˇskov´a difrakce, OpenMP
Abstract
The main topic of this thesis is the processing of data obtained through powder diffraction. In particular, this thesis focuses on the ITO method. This the- sis contains basic crystallographic terminology and that of a related method called powder diffraction. Furthermore, it contains a description of the ITO method, its implementation in the ParaCell program and test results of said implementation.
Keywords Crystallography, Powder diffraction, OpenMP
v
Obsah
Uvod´ 1
1 C´ıle pr´ace a Z´akladn´ı pojmy 3
1.1 C´ıle pr´ace . . . 3
1.2 Skupenstv´ı l´atek . . . 3
1.2.1 Pevn´e l´atky . . . 3
1.3 Krystalografie . . . 4
1.3.1 Krystal . . . 4
1.3.2 Krystalov´a mˇr´ıˇzka . . . 4
1.3.2.1 Bravaisovy typy mˇr´ıˇzek . . . 4
1.3.3 Mˇr´ıˇzov´a rovina . . . 4
1.3.4 Reciprok´a mˇr´ıˇzka . . . 5
1.4 Pr´aˇskov´a difrakce . . . 5
1.4.1 Braggova rovnice . . . 5
1.4.2 Metody pro nalezen´ı krystalov´e struktury z difrakˇcn´ıho z´aznamu . . . 6
2 Metoda ITO 7 2.1 Hled´an´ı z´on . . . 7
2.2 ´Uprava nalezen´ych z´on . . . 8
2.3 Kombinace z´on . . . 9
2.4 Alternativn´ı kombinace z´on . . . 9
3 Implementace 11 3.1 ParaCell . . . 11
3.2 Metoda ITO . . . 11
3.3 Paralelizace . . . 12
4 Testov´an´ı 13 4.1 Testovac´ı platforma . . . 13
vii
4.2 Testovac´ı data . . . 13 4.3 Mˇeˇren´ı kvality v´ysledk˚u . . . 13 4.4 ˇSk´alovatelnost implementace . . . 14
Z´avˇer 17
Literatura 19
A Seznam pouˇzit´ych zkratek 21
B Obsah pˇriloˇzen´eho CD 23
viii
Seznam obr´ azk˚ u
4.1 Kvalita v´ysledk˚u . . . 14 4.2 ˇSk´alovatelnost implementace . . . 15
ix
Uvod ´
Lid´e se odjakˇziva snaˇz´ı porozumˇet svˇetu, ve kter´em ˇzij´ı. Mezi to patˇr´ı i napˇr.
urˇcov´an´ı vlastnost´ı l´atek a mezi ty patˇr´ı i jejich struktura. Tato pr´ace se zab´yv´a strukturou krystalick´ych l´atek, konkr´etnˇe parametry jejich krysta- lov´ych mˇr´ıˇzek.
K urˇcov´an´ı tˇechto parametr˚u vyuˇz´ıv´a dat z´ıskan´ych pomoc´ı metody zvan´e pr´aˇskov´a difrakce. Ty obsahuj´ı z´aznamy o ´uhlech, pod kter´ymi se od nˇejak´eho pr´aˇsku krystalick´e l´atky odrazily nejintenzivnˇejˇs´ıpaprsky rentgenov´eho z´aˇren´ı.
Z tˇechto ´uhl˚u jsou pak pomoc´ı r˚uzn´ych metod vypoˇc´ıt´any parametry krysta- lick´e l´atky, jej´ıˇz vzorek byl podroben pr´avˇe pr´aˇskov´e difrakci.
Tato pr´ace se zamˇeˇruje na jednu z tˇechto metod, konkr´etnˇe metodu ITO.
Metoda ITO byla navrˇzena J. W. Visserem v roce 1969 v jeho ˇcl´anku. C´ılem je integrace t´eto metody do programu ParaCell. Tento program slouˇz´ı pr´avˇe k indexaci dat z pr´aˇskov´e difrakce a tedy k urˇcov´an´ı parametr˚u krystalov´ych mˇr´ıˇzek dan´ych l´atek.
1
Kapitola 1
C´ıle pr´ ace a Z´ akladn´ı pojmy
Tato kapitola obsahuje z´akladn´ı pojmy z krystalografie a dalˇs´ı pojmy uˇz´ıvan´e v t´eto pr´aci.
1.1 C´ıle pr´ ace
C´ılem t´eto pr´ace je implementace metody ITO do programu ParaCell pro indexaci krystalick´ych l´atek z dat z´ıskan´ych pomoc´ı pr´aˇskov´e difrakce.
1.2 Skupenstv´ı l´ atek
Obvykle rozliˇsujeme 3 z´akladn´ı l´atkov´a skupenstv´ı:
• pevn´e
• kapaln´e
• plynn´e
Nˇekdy se jako 4. druh skupenstv´ı uv´ad´ı plazma.
1.2.1 Pevn´e l´atky
Informace o pevn´ych l´atk´ach jsou ˇcerp´any z [1]. Pevn´e l´atky rozdˇelujeme na amorfn´ı a krystalick´e. Rozd´ılem mezi tˇemito dvˇema typy je pravidelnost uspoˇr´ad´an´ı ˇc´astic l´atky.
U amorfn´ıch l´atek lze pozorovat pravidelnost pˇribliˇzne do 10 nm.
Krystalick´e l´atky d´ale dˇel´ıme na monokrystaly a polykrystaly. V mo- nokrystalu se uspoˇr´ad´an´ı ˇc´astic periodicky opakuje. Polykrystal se skl´ad´a z mnoha krystal˚u s rozmˇery od 10 µm do nˇekolika mm.
3
1. C´ıle pr´ace a Z´akladn´ı pojmy
1.3 Krystalografie
Krystalografie je vˇeda, kter´a se zab´yv´a krystalick´ymi pevn´ymi l´atkami a jejich strukturou. Informace v t´eto a n´asleduj´ıc´ı sekci jsou ˇcerp´any z [2].
1.3.1 Krystal
Krystal je peridociky se opakuj´ıc´ı struktura ˇc´astic. Pˇri abstrakci se pouˇz´ıv´a tzv. ide´aln´ı krystal, kter´y je nekoneˇcn´y a jeho struktura se tedy periodicky opakuje do nekoneˇcna. Re´aln´e krystaly vˇsak nejsou nekoneˇcn´e a jejich perio- dicita je tedy naruˇsena pˇrinejmenˇs´ım na jejich okraj´ıch.
1.3.2 Krystalov´a mˇr´ıˇzka
Krystalov´a mˇr´ıˇzka je zp˚usob abstrakce periodicity ˇc´astic v r´amci ide´aln´ıho krystalu. Je charakterizov´ana 6 parametrya, b, c, α, β, γ, kdea, b, cjsou d´elky vektor˚u ~a,~b, ~c a α, β, γ ´uhly sv´ıran´e mezi nimy (α oznaˇcuje ´uhel mezi ~b a ~c atd.). Periodicita je tak vyj´adˇrena jako pˇriˇc´ıt´an´ıceloˇc´ıseln´ych n´asobk˚u vektor˚u
~a,~b, ~c k poˇc´atku.
1.3.2.1 Bravaisovy typy mˇr´ıˇzek
Typicky dˇel´ıme mˇr´ıˇzky na nˇekolik typ˚u, oznaˇcovan´e Bravaisovy typy. Rozliˇsuj´ı se na tˇechto 7 z´akladn´ıch typ˚u:
• triklinick´a:a6=b6=c
• monoklinick´a:a6=b6=c, α=γ, β >90◦
• ortorombick´a:a6=b6=c, α=β =γ = 90◦
• tetragon´aln´ı:a=b6=c, α=β =γ = 90◦
• trigon´aln´ı:a=b6=c, α=β= 90◦, γ= 120◦
• hexagon´aln´ı:a=b6=c, α=β= 90◦, γ= 120◦
• kubick´a:a=b=c, α=β=γ = 90◦ 1.3.3 Mˇr´ıˇzov´a rovina
Mˇr´ıˇzov´a rovina je rovina, kter´a je jednoznaˇcnˇe d´ana 3 r˚uzn´ymi body z krys- talov´e mˇr´ıˇzky a reprezentuje tak ˇrez napˇr´ıˇc krystalem. Mnoˇziny mˇr´ıˇzkov´ych rovin, kter´e jsou navz´ajem rovnobˇeˇzn´e a pro kaˇzd´e 2 sousedn´ı roviny v nich plat´ı, ˇze maj´ı mezi sebou stejnou vzd´alenostd, oznaˇcujeme jako osnovu rovin.
K oznaˇcen´ı osnov rovin se pouˇz´ıvaj´ı Millerovy indexy, tj. 3 cel´a ˇc´ısla oznaˇcovan´a jako h, k a l. Osnova rovin hkl obsahuje mˇr´ıˇzkov´e roviny, kter´e jsou rovnobˇeˇzn´e s rovinou, kter´a prot´ın´a 3 body urˇcen´e vektory ~ha,~bk a ~cl. 4
1.4. Pr´aˇskov´a difrakce
1.3.4 Reciprok´a mˇr´ıˇzka
Reciprok´a mˇr´ıˇzka se zav´ad´ı kv˚uli zjednoduˇsen´ı nˇekter´ych v´ypoˇct˚u. Recipro- kou mˇr´ıˇzku tvoˇr´ı body leˇz´ıc´ı na norm´alov´ych vektorech osnov rovin hkl v od- pov´ıdaj´ıc´ı vzd´alenosti dhkl (vzd´alenost dmezi sousedn´ımi rovinami v osnovˇe hkl).
Reciprok´a mˇr´ıˇzka je charakterizov´ana obdobnˇe jako krystalov´a mˇr´ıˇzka 6 parametry oznaˇcovan´ymi a∗, b∗, c∗, α∗, β∗, γ∗, kdea∗, b∗, c∗ jsou d´elky vektor˚u a~∗, ~b∗, ~c∗ a α∗, β∗, γ∗ ´uhly sv´ıran´e mezi nimy. Plat´ı n´asleduj´ıc´ı vztahy:
• a∗= d1001 ,b∗ = d0101 ,c∗ = d0011
• cosα∗ = cosβsincosβγ−cossinγ α, cosβ∗ = cosαsinαcosγ−cossinγ β, cosγ∗ = cosαsincosαsinβ−cosβ γ
1.4 Pr´ aˇ skov´ a difrakce
Pr´aˇskov´a difrakce je metoda pouˇz´ıv´ana pro urˇcen´ıparametr˚u krystalov´e mˇr´ıˇzky nˇejak´eho re´aln´eho krystalu. Pˇri t´eto metodˇe je pouˇz´ıv´ana krystalick´a l´atka v pr´aˇskov´e formˇe, efektivnˇe tedy ve formˇe mnoha velmi mal´ych krystal˚u (po- lykrystal). Na tento pr´aˇsek je vys´ıl´ano napˇr. rentgenov´e z´aˇren´ı a je sledov´ano a zaznamen´ano pod jak´ymi ´uhly dopad´a nejintenzivnˇejˇs´ı z´aˇren´ı. V takov´em pˇr´ıpadˇe totiˇz doch´az´ı ke konstruktivn´ı interferenci (tj. poˇc´atky vln odraˇzen´ych paprsk˚u jsou od sebe vzd´aleny nˇejak´y n´asobek jejich periody a maj´ı stejn´y smˇer, coˇz vede ke zv´yˇsen´ı amplitudy tˇechto vln) 2 nebo v´ıce odr´aˇzen´ych paprsk˚u. Pˇri pouˇzit´ı krystalick´e l´atky ve formˇe pr´aˇsku je pak tedy velmi pravdˇepodobn´e, ˇze bude obsahovat krystaly spr´avnˇe orientovan´e pro pozo- rov´an´ı tohoto jevu.
1.4.1 Braggova rovnice
Braggova rovnice popisuje podm´ınky, kdy doch´az´ı ke konstruktivn´ı interfe- renci pˇri odrazech rentgenov´eho z´aˇren´ı v krystalu.
nλ= 2dsinθ (1.1)
V rovnici 1.1 nλ oznaˇcuje nˇejak´y cel´y n´asobek vlnov´e d´elky pouˇzit´eho rent- genov´eho paprsku, d oznaˇcuje vzd´alenost mezi rovinami odrazu hkl a θ je
´uhel odrazu. Difrakˇcn´ı z´aznam pak obsahuje tyto ´uhlyθ, pro kter´e byla inten- zita dopadl´eho rentgenov´eho z´aˇren´ı nejvyˇsˇs´ı. Z t´eto rovnice se d´ale odvozuje a oznaˇcuje hodnota Q:
Q= 1
d2 = (2 sinθ
λ )2 (1.2)
5
1. C´ıle pr´ace a Z´akladn´ı pojmy
1.4.2 Metody pro nalezen´ı krystalov´e struktury z difrakˇcn´ıho z´aznamu
Mezi tyto metody patˇr´ı napˇr. Treor, Dicvol, McMaille a tak´e metoda ITO, na kterou se zamˇeˇruje tato pr´ace.
D´ale je tak´e moˇzn´e probl´em ˇreˇsit tak´e napˇr. pomoc´ı systematick´eho pro- hled´av´an´ı parametr˚u mˇr´ıˇzky (pˇr´ım´ych nebo i reciprok´ych parametr˚u), tzv.
Grid search. To se realizuje tak, ˇze pro kaˇzd´y z parametr˚u se urˇc´ı nˇejak´y in- terval a krok mezi hodnotami v tomto intervalu. ˇReˇsen´ı se pak hled´a mezi vˇsemi kombinacemi moˇzn´ych hodnot parametr˚u, kter´e jsou voleny z dan´ych interval˚u.
6
Kapitola 2
Metoda ITO
Tato pr´ace vych´az´ı z metody ITO popsan´e v [3]. N´asleduj´ıc´ı kapitola obsahuje voln´y pˇreklad z tohoto ˇcl´anku.
Metoda vych´az´ı z rovnice:
Qhkl=h2A+k2B+l2C+klD+hlE+hkF (2.1) kde:
A=a∗2, B=b∗2, C =c∗2, D=b∗c∗cosα∗, E =a∗c∗cosβ∗, F =a∗b∗cosγ∗ Z´akladem metody je uvaˇzov´an´ı rovin kde jedno z h, k, nebo l je rovn´e 0.
Rovnice 2.1 se pak redukuje na:
Qm,n=m2Q0+n2Q00+mnR (2.2) kde m a n m˚uˇze odpov´ıdat libovoln´e dvojici z h, k, l a Q0, Q00, R pak od- pov´ıdaj´ıc´ım promˇenn´ymA . . . F.
´Upravou rovnice 2.2 z´ısk´ame rovnost pro R:
R= (Qm,n−m2Q0−n2Q00)/mn (2.3)
2.1 Hled´ an´ı z´ on
Za Q0 a Q00 postupnˇe dosazujeme do rovnice 2.3 vˇsechny moˇzn´e namˇeˇren´e Q hodnoty. Pro kaˇzdou z tˇechto dvojic nalezneme potenci´aln´ı hodnoty R n´asleduj´ıc´ım zp˚usobem. Pro nˇekolik kladn´ych cel´ych hodnot ma ndosad´ıme do rovnice za Qm,n namˇeˇren´e Q hodnoty a uloˇz´ıme si absolutn´ı hodnotu
|R| (staˇc´ı uvaˇzovat pouze absolutn´ı hodnotu, jelikoˇz m nebo n m˚uˇze b´yt i z´aporn´e). Hodnoty |R|, kter´e se pro danou dvojici vyskytuj´ı opakovanˇe, uloˇz´ıme spoleˇcnˇe s danou dvojic´ıQ0aQ00jako jednu z moˇzn´ych z´on. Uvaˇzujeme pouze hodnoty, kter´e se opakuj´ı alespoˇn r-kr´at, kder je nˇejak´a konstanta.
7
2. Metoda ITO
Vzhledem k nepˇresnostem pˇri mˇeˇren´ı Q hodnot nelze pˇredpokl´adat, ˇze spoˇc´ıtan´e|R|hodnoty si budou pˇresnˇe rovny, proto je potˇreba pˇridat nˇejakou toleranci. P˚uvodn´ı ˇcl´anek navrhuje napˇr. vyn´asobit|R|nˇejakou kladnou kon- stantou, zaokrouhlit na nejbliˇzˇs´ı cel´e ˇc´ıslo a pot´e uvaˇzovat hodnoty za rovn´e, pokud rozd´ıl tˇechto hodnot je menˇs´ı neˇz nˇejak´a dalˇs´ı konstanta.
2.2 Uprava nalezen´ ´ ych z´ on
Takto nalezen´e z´ony, tedy trojice Q0, Q00 a R, jsou n´aslednˇe upraveny podle n´asleduj´ıc´ıch pravidel:
• PokudQ0=Q00:
Q0 = 2Q0−R
4 , Q00= 2Q00+R
4 , R= 0
• PokudR=Q0:
Q0 = Q0+R
8 , Q00=Q00−Q0+R
8 , R= 0
• PokudR=Q00:
Q0 =Q0−Q00+R
8 , Q00 = Q00+R
8 , R= 0
• PokudR > Q0:
Q0 =Q0, Q00 =Q0+Q00−R, R= 2Q0−R
Parametry upraven´ych z´on jsou nad´ale vylepˇseny pomoc´ı metody nejmenˇs´ıch ˇctverc˚u. Tedy pro hodnoty m a n, pro kter´e je vypoˇcten´a hodnota Qm,n v toleranci nˇejak´e namˇeˇren´e hodnotyQ, minimalizujeme chybu (Qm,n−Q)2.
D´ale je pro vˇsechny z´ony vypoˇctena pravdˇepodobnost, ˇze byly nalezeny n´ahodou, kter´a je pouˇzita pro kvalitativn´ı ohodnocen´ı dan´e z´ony. Oznaˇc´ıme tuto pravdˇepodobnost C a poˇc´ıt´ame n´asleduj´ıc´ım zp˚usobem:
C= Nc!
No!(Nc−No)!pNo(1−p)Nc−No (2.4) kdep= PQmax∆Q,Nc je poˇcet dvojicm a n, pro kter´e vypoˇcten´a hodnota Qm,n je v toleranci nˇejak´e namˇeˇren´e hodnotyQ, aNo je celkov´y poˇcet testovan´ych dvojicman. Inverzn´ıhodnotu t´eto pravdˇepodovnosti C1 oznaˇc´ıme jako kvalitu dan´e z´ony.
8
2.3. Kombinace z´on
2.3 Kombinace z´ on
Pro vˇsechny dvojice z´on, kter´e dosahuj´ı nˇejak´e poˇzadovan´e podm´ınky na jejich kvalitu C1, se pokus´ıme naj´ıt jejich pr˚unik a tedy parametry A . . . F. To je provedeno tak, ˇze pro kaˇzdou z´onu jsou spoˇc´ıt´any 4 nejmenˇs´ı Q hodnoty, konkr´etnˇe Q0, Q00, Q0 +Q00−R, Q0 +Q00+R. Tyto hodnoty jsou porovn´any.
Pokud je nalezena spoleˇcn´a Q hodnota, lze definovat pr˚unik tˇechto z´on jako:
A=Qc, B=Q1,1, C=Q2,1, E =Qc+Q2,1−Q2,2, F =Qc+Q1,1−Q1,2 kdeQcje nalezen´a spoleˇcn´a hodnota,Q1,1, Q2,1 jsou nejmenˇs´ı Q hodnoty 1. a 2. z´ony r˚uzn´e odQc, obdobnˇeQ1,2, Q2,2 jsou 2. nejmenˇs´ı hodnoty.
D´ale je nutn´e dopoˇc´ıtat parametrD. Ten je spoˇc´ıt´an podobn´ym zp˚usobem jakoR, ale z upraven´e rovnice 2.1:
D= (Q−h2A−k2B−l2C−hlE−hkF)/(kl) (2.5) Za hodnoty h, k, l dosazujeme:
h∈ h−2,2i, k∈ {−2,−1,1,2}, l∈ {1,2} Na z´avˇer jsou provedeny tyto ´upravy:
• PokudA=B a F = 0:
A0 = A+B−F
4 , B0= A+B+F
4 , C0=C, D0= D−E
2 , E0 = D+E
2 , F0 = 0
• PokudF =A neboF =B: A0 = A
4, B0=B−A
4, C0 =C, D0 =D−E
2, E0 = E
2, F0= 0 Obdobnˇe pak pro kombinace A, C, E a B, C, D.
2.4 Alternativn´ı kombinace z´ on
Hledat pr˚unik z´on je tak´e moˇzn´e pˇreveden´ım reciprok´ych parametr˚uQ0, Q00, R na pˇr´ım´e mˇr´ıˇzkov´e parametry. T´ım z´ısk´ame parametryx, y, ω. V tomto pˇr´ıpadˇe uvaˇzujeme trojice skupin tˇechto parametr˚u, kter´e interpretujeme jako a, b, γ, a, c, β a b, c, α resp. Pokud nast´av´a pˇribliˇzn´a rovnost mezi parametry a, b, c napˇr´ıˇc vˇsemi tˇemito trojicemi, nalezli jsme potenci´aln´ı parametry mˇr´ıˇzky.
9
Kapitola 3
Implementace
Implementace byla provedena v jazyce C++, ve kter´em je implementov´an n´astroj ParaCell.
3.1 ParaCell
ParaCell je n´astroj pro indexaci dat pr´aˇskov´e difrakce, dostupn´y z [4]. Hlavn´ım autorem je doc. Ing. Ivan ˇSimeˇcek, Ph.D., vedouc´ı t´eto pr´ace. Aktu´aln´ı verze ParaCellu obsahuje algoritmy MGLS, DICVOL, TREOR a Grid search. C´ılem t´eto pr´ace je rozˇs´ıˇrit ParaCell o metodu ITO.
Implementaci ParaCellu lze rozdˇelit do 3 hlavn´ıch modul˚u. Prvn´ı modul se star´a o ˇcten´ı vstupn´ıch dat a konfiguraˇcn´ıho souboru. Druh´ym jsou pak implementace r˚uzn´ych metod, kter´e ze vstupn´ıch dat vypoˇc´ıtaj´ı kandid´aty krystalov´e mˇr´ıˇzky odpov´ıdaj´ıc´ı vstupn´ım dat˚um. Tˇret´ı modul pak tyto kan- did´aty vyhodnot´ı.
3.2 Metoda ITO
V r´amci t´eto pr´ace byla pro program ParaCell implementov´ana metoda ITO popsan´a v kapitole 2.
Hled´an´ı potenci´aln´ıch R hodnot bylo implementov´ano t´ımto zp˚usobem.
Pole s potenci´aln´ımi R hodnotami je seˇrazeno. Pot´e se hledaj´ı skupiny sou- sedn´ıch prvk˚u, kter´e obsauj´ınˇejak´y zvolen´y minim´aln´ıpoˇcet prvk˚u a pro prvky t´eto skupiny plat´ı, ˇze jejich rozd´ıl od pr˚umˇeru skupiny je menˇs´ı neˇz nˇejak´a zvolen´a konstanta. Stejn´ym zp˚usobem jsou hled´any i hodnoty parametru D.
Vylepˇsen´ım oproti origin´aln´ımu algoritmu je, ˇze zaQ0 aQ00 se pˇri hled´an´ı parametr˚u Q0, Q00 a R dosazuj´ı kromˇe namˇeˇren´ych Q hodnot tak´e hodnoty
Q
4, Q9 a 16Q. To protoˇze nˇekter´e difkrakˇcn´ı z´aznamy neobsahuj´ı reflexe rovin hkl typu 001 atp. Mohou ale obsahovat napˇr. reflexe 002, z tohoto d˚uvodu m´a smysl uvaˇzovat hodnoty Q4 atd.
11
3. Implementace
3.3 Paralelizace
K paralelizaci byla vyuˇzita technologie OpenMP, kter´a je pouˇzita i v ostatn´ıch ˇc´astech ParaCellu. OpenMP umoˇzˇnuje paralelizaci C++ k´odu pomoc´ı direktiv pˇrekladaˇce.
K paralelizaci byla vyuˇzita direktiva #pragma omp parallel for, kter´a umoˇzˇnuje paralelizaci for cykl˚u. Pomoc´ı t´eto direktivy byly paralelizov´any vnˇejˇs´ı cykly 2 hlavn´ıch ˇc´ast´ı implementovan´eho algoritmu, tj. hled´an´ı trojic Q0, Q00, Ra n´asledn´e sestavov´an´ı mˇr´ıˇzkov´ych parametr˚u z tˇechto trojic.
12
Kapitola 4
Testov´ an´ı
4.1 Testovac´ı platforma
Program byl testov´an na ˇskoln´ım clusteru star.fit.cvut.cz. Jeho specifikace jsou:
• CPU: 2×Intel Xeon 2620 v2
• 32 GB RAM
• GPU: Tesla P100, GeForce RTX 2080 Ti, Tesla K40c, GeForce GTX 780 Ti a GeForce GTX 750
4.2 Testovac´ı data
Program byl testov´an na datech z´ıskan´ych z [5]. Konkr´etnˇe se jednalo o 6 z´aznam˚u s kubickou, 9 s hexagon´aln´ı, 25 s monoklinickou, 18 s ortorombickou, 7 s tetragon´aln´ı a 35 s triklinickou mˇr´ıˇzkou.
4.3 Mˇ eˇ ren´ı kvality v´ ysledk˚ u
K mˇeˇren´ı kvality v´ysledk˚u se pouˇz´ıv´a FN index popsan´y v [6]. Poˇc´ıt´a se n´asleduj´ıc´ım zp˚usobem:
FN = N
|∆2θ|Nc (4.1)
kde N je poˇcet namˇeˇren´ych reflex´ı, Nc je poˇcet moˇzn´ych vypoˇc´ıtan´ych re- flex´ı aˇz do hodnoty reflexe s indexem N a |∆2θ| je pr˚umˇern´y rozd´ıl mezi namˇeˇren´ymi a vypoˇc´ıtan´ymi reflexemi.
K mˇeˇren´ı kvality v´ysledk˚u je pouˇzit pomˇer hodnotF20dosaˇzen´e metodou ITO kuF20 pro parametry mˇr´ıˇzek uveden´e v z´aznamech z [5]. Tyto z´aznamy neuv´ad´ı konkr´etn´ı hodnotu F20, ale pouze parametry krystalov´ych mˇr´ıˇzek.
13
4. Testov´an´ı
Hodnoty F20 tedy byly vypoˇc´ıt´any pomoc´ı programu ParaCell pˇri pouˇzit´ı tˇechto mˇr´ıˇzkov´ych parametr˚u.
Namˇeˇren´e hodnoty pro jednotliv´e typy krystalov´ych mˇr´ıˇzek lze vidˇet na obr´azku 4.1. Reprezentuj´ı pr˚umˇern´y pomˇer popsan´y v pˇredchoz´ım odstavci na testovac´ıch datech. Pro triklinick´e typy mˇr´ıˇzek byl namˇeˇren pr˚umˇern´y pomˇer 86,6. D˚uvodem je, ˇze u triklinick´ych mˇr´ıˇzek se nejv´ıce projev´ı i ty nejmenˇs´ı zmˇeny parametr˚u mˇr´ıˇzky, protoˇze jich maj´ı nejv´ıce nezn´am´ych. Napˇr. z tes- tovac´ı sady u z´aznamu miner´alu vauxit se spoˇc´ıtan´e pˇr´ım´e parametry liˇsily od tˇech uveden´ych v z´aznamu o jednotky tis´ıcin a jen ve 4 ze 6 parametr˚u.
I pˇresto byl pod´ıl hodnot F20 rovn´y 407,127,8 ≈ 14,64. Z podobn´ych d˚uvod˚u lze pak pozorovat pomˇer vˇetˇs´ı neˇz 1 i u ostatn´ıch typ˚u mˇr´ıˇzek.
0.01 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.91 1.11.2
PomˇerF20
Kubick´e Hexagon´aln´ı Monoklinick´e Ortorombick´e Tetragon´aln´ı
Triklinick´e
Obr´azek 4.1: Kvalita v´ysledk˚u
Z v´ysledk˚u lze tvrdit, ˇze tato implementace metody ITO je vhodn´a hlavnˇe pro kubick´e, tetragon´aln´ı a triklinick´e typy mˇr´ıˇzek. Pro ostatn´ı je metoda tak´e pouˇziteln´a, ale nemus´ı nal´ezt spr´avn´e ˇreˇsen´ı.
4.4 Sk´ ˇ alovatelnost implementace
Na obr´azku 4.2 je vyobrazen pomˇer ˇcasu bˇehu implementace pˇri dan´em poˇctu vl´aken ku dobˇe trv´an´ı bˇehu s 1 vl´aknem. ˇSk´alovatelnost nen´ı ani pˇribliˇznˇe line´arn´ı. Z´aroveˇn si lze vˇsimnout, ˇze pˇri pouˇzit´ı technologie Hyper-Threading (technologie pro bˇeh 2 vl´aken na jednom fyzick´em j´adˇre) doch´az´ı dokonce ke zpomalen´ı v´ypoˇctu.
14
4.4. ˇSk´alovatelnost implementace
0 5 10 15 20 25
1 2 3 4
Poˇcet vl´aken
Pomˇerkˇcasu1vl´akna
Obr´azek 4.2: ˇSk´alovatelnost implementace
15
Z´ avˇ er
C´ılem t´eto pr´ace byla implementace metody ITO do programu ParaCell. Tato metoda byla implementov´ana a kvalitativnˇe vykazovala uspokojiv´e v´ysledky.
ˇSk´alovatelnost t´eto implementace na v´ıce jader procesoru vˇsak byla m´enˇe
´uspˇeˇsn´a, dosahovala m´enˇe neˇz 4×rychlejˇs´ıch ˇcas˚u pˇri pouˇzit´ı 12 jader.
17
Literatura
[1] Krystalick´e a amorfn´ı l´atky. Dostupn´e z: http://fyzika.jreichl.com/
main.article/view/622-krystalicke-a-amorfni-latky, [cit. 2021-06- 27].
[2] Uˇcebnice mineralogie pro bakal´aˇrsk´e studium. Dostupn´e z: http://
mineralogie.sci.muni.cz/obsah_uceb.htm, [cit. 2021-06-27].
[3] Visser, J. W.: A fully automatic program for finding the unit cell from powder data.Journal of Applied Crystallography, roˇcn´ık 2, ˇc. 3, Aug 1969:
s. 89–95, doi:10.1107/S0021889869006649. Dostupn´e z:https://doi.org/
10.1107/S0021889869006649
[4] ParaCell download — SourceForge.net. https://sourceforge.net/
projects/paracell/, [cit. 2021-06-27].
[5] American Mineralogist Crystal Structure Database. Dostupn´e z: http:
//rruff.geo.arizona.edu/AMS/amcsd.php, [cit. 2021-06-27].
[6] Smith, G. S.; Snyder, R. L.: FN: A criterion for rating powder di- ffraction patterns and evaluating the reliability of powder-pattern inde- xing. Journal of Applied Crystallography, roˇcn´ık 12, ˇc. 1, Feb 1979: s.
60–65, doi:10.1107/S002188987901178X. Dostupn´e z: https://doi.org/
10.1107/S002188987901178X
19
Pˇ r´ ıloha A
Seznam pouˇ zit´ ych zkratek
CPU Central processing unit RAM Random access memory
21
Pˇ r´ ıloha B
Obsah pˇ riloˇ zen´ eho CD
src
impl...zdrojov´e k´ody implementace thesis ...zdrojov´a forma pr´ace ve form´atu LATEX text ...text pr´ace DP Cermak Michal 2020.pdf ...text pr´ace ve form´atu PDF
23