Line´ arn´ı algebra — 10. pˇ redn´ aˇ ska: Ortogonalita II
Dalibor Luk´aˇs
Katedra aplikovan´e matematiky FEI VˇSB–Technick´a univerzita Ostrava
email: dalibor.lukas@vsb.cz http://homel.vsb.cz/∼luk76/LA1
Text byl vytvoˇren v r´amci realizace projektu Matematika pro inˇzen´yry 21. stolet´ı(reg. ˇc. CZ.1.07/2.2.00/07.0332), na kter´em se spoleˇcnˇe pod´ılela Vysok´a ˇskola b´aˇnsk´a – Technick´a univerzita Ostrava a Z´apadoˇcesk´a univerzita v Plzni
Ortogonalita = kolmost
Pythagorova vˇeta: x, y ∈ R2 : x⊥y ⇔ kxk2 + kyk2 = kx + yk2
kxk
kyk kx + yk
kx + yk2 = (x + y) · (x + y) = x · x + y · y + 2x · y= kxk2 + kyk2 + 2x · y
Vektory x a y jsou ortogon´aln´ı(kolm´e), pokud x · y = 0.
Projekce na podprostor
1D
a b
p e
Projekce b na poprostor hai Najdi p := xa : (b − p)⊥a
2D
Projekce b na poprostor ha1,a2i
Najdi p := x1a1 + x2a2 : (b − p)⊥a1 a (b − p)⊥a2
Motivace
JPEG komprese je projekce na podprostor
p˚uvodn´ı bitmapa 10% komprese Fourierovou b´az´ı
Metoda nejmenˇ s´ıch ˇ ctverc˚ u = projekce na podprostor
Pˇr´ıklad: Opakovan´ym mˇeˇren´ım pulzu jsme namˇeˇrili hodnoty: 72, 75, 69, 73. Kolik je spr´avn´a hodnota?
Chceme naj´ıt x, kter´e nejv´ıce vyhovuje soustavˇe n´asleduj´ıc´ıch 4 rovnic o 1 nezn´am´e:b (1, 1, 1,1)T
| {z }
=:A
x = (72, 75, 69, 73)T
| {z }
=:b
.
Reˇsen´ım jeˇ x, kter´e minimalizuje n´asleduj´ıc´ı eukleidovskou normu chyby ˇreˇsen´ıb kAxb − bk2 = (xb − 72)2 + (xb − 75)2 + (xb − 69)2 + (bx − 73)2.
Uk´aˇze se, ˇze v´ysledek splˇnuje norm´alovou rovnici AT · A · xb = AT · b
a v tomto pˇr´ıpadˇe se jedn´a o aritmetick´y pr˚umˇer (ve statistice ,,stˇredn´ı hodnota”) b
x = 1
4(72 + 75 + 69 + 73) = 72, 25.
Metoda nejmenˇ s´ıch ˇ ctverc˚ u = projekce na podprostor
Pˇr´ıklad: Proloˇzte body (1, 1), (2, 3) a (3,4) nejlepˇs´ı pˇr´ımkou.
Hled´ame parametry a, b ∈ R pˇr´ımky P :=
(x, y) ∈ R2 : y(x) := ax + b tak, ˇze n´asleduj´ıc´ı chyba je minimalizov´ana (ve statistice ,,line´arn´ı regrese”)
k(y(1), y(2), y(3)) − (1,3,4)k2 = (a · 1 + b − 1)2 + (a · 2 + b − 3)2 + (a · 3 + b − 4)2.
0 1 2 3 4
0 1 2 3 4
5 Uk´aˇze se, ˇze v´ysledek y(x) := (3/2)x − 1/3 splˇnuje norm´alovou rovnici
AT·A·
ba bb
= AT·b, kde A :=
1 1 2 1 3 1
, b :=
1 3 4
.
V tomto pˇr´ıpadˇe ˇreˇsen´ıminimalizuje obsahy ˇctverc˚u, odtud n´azev metody.
Ortogon´ aln´ı podprostory
Definice
Podprostory U a V prostoru Rn jsou ortogon´aln´ı, pokud
∀u ∈ U ∀v ∈ V : u · v = 0.
U V
0
U
V
0
Ortogon´ aln´ı podprostory
N(A)⊥R(A)
Mˇejme matici A ∈ Rm×n. Pˇripomeˇnme si jej´ı nulov´y prostor
N(A) := {x ∈ Rn : A · x = 0} = {x ∈ Rn : ∀i ∈ {1, . . . , m} : ari · x = 0} . Vid´ıme, ˇze vektory x z nulov´eho prostoru jsou kolm´e na vˇsechny ˇr´adky matice A, tedy i na jejich libovolnou lin. kombinaci, coˇz jsou prvky z ˇr´adkov´eho prostoru
R(A) := {α1ar1 + · · · + αmarm : α1, . . . , αm ∈ R} = H(AT).
Analogicky: N(AT)⊥H(A) nebot’ H(A) = R(AT).
Ortogon´ aln´ı projektory
1D
a b
p
e Mˇejme a, b ∈ Rm. Projekc´ı vek-
toru b na podprostor hai se rozum´ı
´uloha
Najdi p := xa : (b − p)
| {z }
=e
⊥a.
Uvaˇzujme nyn´ıa, b ∈ Rm×1 jako sloupcov´e vektory. Z definice ortogonality dost´av´ame x = bT · a
aT · a, p =
bT · a aT · a
a = 1
aT · a a · aT
| {z }
=:P
· b
Matice P ∈ Rm×m se naz´yv´a ortogon´aln´ı projektor.
Ortogon´ aln´ı projektory
Ortogon´aln´ı projekce na line´arn´ı obal vektor˚u
Mˇejme a1, . . . ,an ∈ Rm. Ortogon´aln´ı projekc´ı vektoru b ∈ Rm na poprostor ha1, . . . ,ani se rozum´ı ´uloha
Najdi p := x|1a1 + · · ·{z + xnan}
=A·x
: (b − p)
| {z }
=e
⊥ai pro kaˇzd´e i ∈ {1, . . . , n},
kde A := (a1, . . . ,am) ∈ Rm×n. Podm´ınka ortogonality 0 = eT · A = (b − A · x)T · A vede na norm´alovou rovnici
AT · A · x = AT · b,
kter´a m´a jednoznaˇcn´e ˇreˇsen´ı, jsou-li vektory a1, . . . ,an lin. nez´avisl´e. V´ysledn´y vektor p = A · (AT · A)−1 · AT
| {z }
=:P
· b,
kde P ∈ Rm×m je ortogon´aln´ı projektor.
Ortogon´ aln´ı projektory
Vlastnosti
Uvaˇzujme line´arnˇe nez´avisl´e sloupce matice A := (a1, . . . ,an) ∈ Rm×n. Ortogon´aln´ı projektor na H(A) je matice (lin. zobrazen´ı)
P = A · AT · A−1
· AT a m´a tyto vlastnosti
• P je symetrick´a, tj. PT = P (plyne ze symetrie AT · A),
• P je idempotentn´ı (staˇc´ı aplikovat jednou), tj.
P · P =
A · AT · A−1
· AT
·
A · AT · A−1
· AT
=
= A · AT · A−1
· AT · A
| {z }
=I
· AT · A−1
· AT= P.
Doplˇnkov´y projektor
Matice I−P je ortog. projektor na ortogon´aln´ı doplnˇek N(AT). Plat´ı: N(AT)⊥H(A).
Ortogon´ aln´ı projektory
N(AT) ⊕ H(A) = Rn
Mˇejme matici A ∈ Rm×n s lin. nez´avisl´ymi sloupci. Uˇz v´ıme, ˇze N(AT)⊥H(A).
Z Frobeniovy vˇety plyne, ˇze
dimN(AT) + dimH(A) = n,
a tedy existuje rozklad libovoln´eho vektoru x = y + z, kde y ∈ N(AT) a z ∈ H(A).
Tento rozklad je jednoznaˇcn´y
x = (I − P) · x
| {z }
∈N(AT)
+ P| {z }· x
∈H(A)
,
kde P je ortogon´aln´ı projektor na H(A) a I − P je jeho ortogon´aln´ı doplnˇek.
Ortogon´ aln´ı projektory
Norm´alov´a rovnice
Mˇejme matici A := (a1, . . . ,an) ∈ Rm×n s lin. nez´avisl´ymi sloupci a b ∈ Rm. Pokud b 6∈ H(A), pak soustava
A · x = b
nem´a ˇreˇsen´ı. Pˇresto m˚uˇze m´ıt smysl ˇreˇsit n´asleduj´ıc´ı soustavu:
A · xb = P · b, kde P := A · AT · A−1
· AT je ortogon´aln´ı projektor na H(A). Jelikoˇz A m´a lin.
nez´avisl´e sloupce, soustava je ekvivalentn´ı norm´alov´e rovnici AT · A · xb = AT · b.
Pokud b ∈ H(A), pak P·b = b a norm´alov´a rovnice je ekvivalentn´ı s p˚uvodn´ı. Pokud je nav´ıc A (ˇctvercov´a) regul´arn´ı, pak
P = A · (AT · A)−1 · AT = A · A−1
· (AT)−1 · AT
= I.
Ortogon´ aln´ı projektory
Pˇr´ıklad: Opakovan´ym mˇeˇren´ım pulzu jsme namˇeˇrili hodnoty: 72, 75, 69, 73. Kolik je spr´avn´a hodnota?
Chceme naj´ıt x, kter´e ,,nejv´ıce” vyhovuje soustavˇe n´asleduj´ıc´ıch 4 rovnic o 1 nezn´am´e:b
1 1 1 1
| {z }
=:A
·x =
72 75 69 73
| {z }
=:b
.
Ortogon´aln´ı projekce prav´e strany na H(A) vede na norm´alovou rovnici
(1, 1, 1,1) ·
1 1 1 1
· xb = (1,1,1,1) ·
72 75 69 73
,
coˇz d´av´a ˇreˇsen´ı jako aritmetick´y pr˚umˇer namˇeˇren´ych hodnot xb = 1
4(72 + 75 + 69 + 73)= 72,25.
Ortogon´ aln´ı projektory
Pˇr´ıklad: Proloˇzte body (1, 1), (2, 3) a (3,4) nejlepˇs´ı pˇr´ımkou.
Hled´ame parametry a, b ∈ R pˇr´ımky P :=
(x, y) ∈ R2 : y(x) := ax + b , tj. chceme ˇreˇsit soustavu rovnic
1 1 2 1 3 1
| {z }
=:A
· a
b
=
1 3 4
| {z }
=:b
.
Ortogon´aln´ı projekce prav´e strany na H(A) vede na norm´alovou rovnici 1 2 3
1 1 1
·
1 1 2 1 3 1
· ba
bb
=
1 2 3 1 1 1
·
1 3 4
,
jehoˇz ˇreˇsen´ı je
ba = 3/2, bb = −1/3.
Ortogon´ aln´ı projektory
Gram–Schmidt˚uv ortogonalizaˇcn´ı/ortonormalizaˇcn´ı algoritmus
Mˇejme b´azi E := (e1, . . . ,en) prostoru Rn. Ortogonalizujme/ortonormalizujme ji.
f1 := e1, q1 := 1
kf1kf1,
fi := ei −
Xi−1 j=1
αijfj, kde αij = ei · fj
fj · fj, qi := 1
kfikfi, pro i ∈ {2, . . . , n}.
V´ysledkem je ortog. b´aze F := (f1, . . . ,fn), resp. ortonorm. b´aze Q := (q1, . . . ,qn).
Gram–Schmidt˚uv algoritmus pomoc´ı ortogon´aln´ıch projektor˚u Uvaˇzujme vˇsechny vektory jako sloupcov´e, pak pro i ∈ {2, . . . , n}
fi = ei −
Xi−1 j=1
eTi · fj
fjT · fj · fj = ei −
Xi−1 j=1
1
fjT · fj fj · fjT
| {z }
=:Pj
·ei=
I −
Xi−1 j=1
Pj
· ei.
Metoda nejmenˇ s´ıch ˇ ctverc˚ u = ortogon´ aln´ı projekce prav´ e strany
,,Nejlepˇs´ı” kandid´at na ˇreˇsen´ı minimalizuje normu chyby.
Mˇejme matici A ∈ Rm×n a b ∈ Rm. Pokud b 6∈ H(A), pak soustava A · x = b
nem´a ˇreˇsen´ı. ,,Nejlepˇs´ı” kandid´at bx ∈ Rn na ˇreˇsen´ı minimalizuje normu chyby, tj.
∀y ∈ Rn : kA · bx − bk2 ≤ kA · (bx + y) − bk2. Nerovnici lze pˇrepsat takto:
0 ≤ y|T · A{zT · A · y}
=kA·yk2
+2yT · AT · A · bx − 2yT · AT · b.
Vezmˇeme lib. vektor z kanonick´e b´aze ei ∈ Rn, ε > 0 a zvolme dvˇe y := ±εei, pak 0 ≤ εkA · vk2 ± 2(AT · A · xb − AT · b)i.
Jelikoˇz obˇe nerovnosti plat´ı pro lib. mal´e ε > 0 a libovoln´y index i ∈ {1, . . . , n}, pak AT · A · xb = AT · b,
tedy opˇet ˇreˇs´ıme norm´alovou rovnici.
Skal´ arn´ı souˇ cin
Zobecnˇen´ı pojm˚u
Mˇejme vektorov´y prostor V a symetrickou biline´arn´ı formu B : V × V → R, jej´ıˇz pˇr´ısluˇsn´a kvadratick´a forma Q(v) := B(v,v) je pozitivnˇe definitn´ı.
• B je skal´arn´ı souˇcin na V.
• Nenulov´e vektory u,v ∈ V jsou ortogon´aln´ı vzhledem k B, pokud (u,v)B := B(u, v) = 0.
• B indukuje normu vektoru v ∈ V kvkB := p
B(u, u).
Pˇr´ıklad: B(x,y) := 2x1y1 − x1y2 − x2y1 + 2x2y2 je skal´arn´ı souˇc´ın na R2. B je zjevnˇe symetrick´a biline´arn´ı forma. Pˇr´ısluˇsn´a kvadr. forma
Q(x) := B(x,x) = 2(x1)2 − 2x1x2 + 2(x2)2 = (x1)2 + (x2)2 + (x1 − x2)2 > 0 pro x 6= 0, tedy Q je pozitivnˇe definitn´ı.
Skal´ arn´ı souˇ cin
B(p, q) := R1
0 p(x)q(x)dx je (L2) skal´arn´ı souˇcin na P1.
Zvolme kanonickou b´azi E := (1, x) prostoru P1. Matice biline´arn´ı formy je
BE :=
B(1,1) B(1, x) B(x,1) B(x, x)
=
R1
0 1dx R1
0 x dx R 1
0 x dx R1
0 x2 dx
!
=
1 12
1 2
1 3
.
Biline´arn´ı forma je tedy symetrick´a. Klasifikujme jej´ı matici kongruencemi 1 12
1 2
1 3
r2:=−r1+2r2
−−−−−−−→
1 12 0 16
s2:=−s1+2s2
−−−−−−−→
1 0 0 1 3
,
a jelikoˇz 1, 13 > 0, kvadratick´a forma je pozitivnˇe definitn´ı.
Fourierova b´aze, viz jpeg, je ortonorm´aln´ı v tomto skal´arn´ım souˇcinu.