Proteiny - jejich struktura a podobnost
Jakub Galgonek
Katedra softwarového inženýrství Univerzita Karlova v Praze
18. prosince 2008
Proteiny
základní stavební kameny života slouží jako:
zdroj energie
enzymy
signální molekuly receptory
transportní proteiny . . .
Aminokyseliny
20 standardních aminokyselin + selenocystein další vytváˇreny posttranslaˇcními úpravami
d ˇeleny do n ˇekolika kategorií:
hydrofilní zásadité kyselé polární hydrofobní
nepolární
Primární proteinová struktura
tvoˇrena sekvencí aminokyselin spojeny peptidickou vazbou
aminokyseliny vesm ˇes planární variabilita dána dvojicí torzních úhl ˚u
Sekundární struktura - alfa helix
pravotoˇcivá šroubovice 3,6 aminokyseliny na otáˇcku
CO skupina se pojí vodíkovými m ˚ustky s NH skupinou o ˇctyˇri aminokyseliny dále
Sekundární struktura - alfa helix
pravotoˇcivá šroubovice 3,6 aminokyseliny na otáˇcku
CO skupina se pojí vodíkovými m ˚ustky s NH skupinou o ˇctyˇri aminokyseliny dále
Sekundární struktura - beta list
tvoˇren dv ˇema ˇret ˇezci spojenými vodíkovými m ˚ustky varianty:
paralelní antiparalelní
Sekundární struktura - beta list
tvoˇren dv ˇema ˇret ˇezci spojenými vodíkovými m ˚ustky varianty:
paralelní antiparalelní
Terciární proteinová struktura
tvoˇrena alfa helixy, beta listy, otáˇckami a smyˇckami uplat ˇnují se:
vodíkové m ˚ustky hydrofobní interakce další slabší interakce SS-m ˚ustky . . .
Terciární proteinová struktura
tvoˇrena alfa helixy, beta listy, otáˇckami a smyˇckami uplat ˇnují se:
vodíkové m ˚ustky hydrofobní interakce další slabší interakce SS-m ˚ustky . . .
Ústˇrední dogma
sekvence → struktura → funkce
Problém vztahu struktury a funkce
Problém vztahu sekvence a struktury
struktura nezávisí jen na sekvenci konformaci
ovliv ˇnuje chemické složení prostˇredí zm ˇeny konformace mají biologický význam chaperony a chaperoniny - pomáhají zaujmout správnou
Metody ur ˇcování struktury proteinu
fyzikální
krystalografie
magnetická rezonance výpoˇcetní
ab initio
comparative modeling fold-recognition
profile-based methods threading methods
Krystalografie
Kroky:
1 purifikace
2 krystalizace
3 difrakˇcní experiment
4 redukce dat
5 vyˇrešení struktury
6 ˇcišt ˇení
7 interpretace
Comparative modeling
Srovnávám danou sekvenci se sekvencemi protein ˚u se známou strukturou. Na základ ˇe alignmentu urˇcím strukturu.
Využívá se dynamického programování.
A S D D R E S
0 0 0 0 0 0 0 0
A 0 1 0,4 0 0 0 0 0
S 0 0,4 2 1,4 0,8 0,2 0 1
S 0 0 1,4 2 1,4 0,8 0,2 1
D 0 0 0,8 2,4 3 2,4 1,8 1,2
E 0 0 0,2 1,8 2,4 3 3,4 2,8
D 0 0 0 1,2 2,8 2,4 3 3,4
S 0 0 1 0,6 2,2 2,8 2,4 4
Profile-based methods
Srovnávám danou sekvenci se sekvencemi protein ˚u se známou strukturou na základ ˇe jejich fyzikálních a chemických vlastností.
Sleduji napˇríklad:
hydrofobnost/hydrofilnost
výskyt v alfa helixech ˇci beta listech . . .
Threading methods
Navlékám danou sekvenci na známé struktury. Poˇcítám fitness funkci urˇcující energii takovéto konformace. Vybírám konformaci s nejnižší energií.
Algoritmus založen na myšlence, že je více smysluplných sekvencí než konformací.
RMSD - Root mean square deviation
E = X
n
(|xn−yn|2)
RMSD - problém superpozice
Emin = X
n
(|xn−Uminyn−cmin|2)
RMSD - posunutí lze eliminovat
E = X
n
(|xn−Uyn−c|2)
= X
n
(|xn−Uyn|2) +
nc2−UP
nyn−P
nxn
√n
2
−|UP
nyn−P
nxn|2 n
E se minimalizuje procmin= U
P
nyn−P
nxn
n
E = X
n
(|xn−Uy|2)−|UP
nyn−P
nxn|2 n
RMSD - rotaci není nutné pˇrímo po ˇcítat
Emin = X
n
(|xn−Uminyn|2)
= X
n
(|xn|2+|yn|2)−2X
n
xnTUminyn
= X
n
(|xn|2+|yn|2)−2
pλ1(M) +p
λ2(M) +|det(R)|
det(R)
pλ3(M)
kdeX•,n=xn,Y•,n=yn,R=YXT,M =RTR.
RMSD - rotaci není nutné pˇrímo po ˇcítat
Lmax = X
n
xnTUyn
= Tr(XTUY)
= Tr(UYXT)
= Tr(UVSWT)
= Tr(SWTUV)
= Tr(ST)
= σ1T1,1+σ2T2,2+σ3T3,3
= σ1+σ2+σ3