Forma dwuliniowa

Forma dwuliniowa albo funkcjonał dwuliniowyprzekształcenie dwuliniowe danej przestrzeni liniowej w ciało jej skalarów, czyli dwuargumentowy funkcjonał, który jest liniowy ze względu na oba parametry. Studiowanie form dwuliniowych sprowadza się do badania wyniku utożsamienia danej przestrzeni liniowej z przestrzenią dualną do niej; różne utożsamienia wprowadzają różne geometrie na rozpatrywanej przestrzeni liniowej: w szczególności przestrzenie liniowe z wyróżnioną dodatnio określoną, symetryczną formą dwuliniową tworzą przestrzeń unitarną (tzn. przestrzeń liniową z wyróżnionym iloczynem skalarnym). Uogólnieniem form dwuliniowych są formy wieloliniowe.

Artykuł traktuje o formach, której argumenty należą do jednej przestrzeni; formy określone na dowolnej ich parze opisano w artykule o parze dualnej.

Definicja formy dwuliniowej

Niech V {\displaystyle V} będzie przestrzenią liniową nad ciałem K . {\displaystyle K.}

Przekształcenie B : V × V K {\displaystyle B\colon V\times V\to K} nazywa się formą dwuliniową (funkcjonałem dwuliniowym) na V , {\displaystyle V,} jeżeli jest:

  • liniowe ze względu na pierwszą zmienną, tzn. addytywne i jednorodne względem pierwszego argumentu
    B ( x + y , z ) = B ( x , z ) + B ( y , z ) {\displaystyle B(\mathbf {x} +\mathbf {y} ,\mathbf {z} )=B(\mathbf {x} ,\mathbf {z} )+B(\mathbf {y} ,\mathbf {z} )}
    oraz
    B ( c x , y ) = c B ( x , y ) {\displaystyle B(c\,\mathbf {x} ,\mathbf {y} )=c\,B(\mathbf {x} ,\mathbf {y} )}
  • liniowe ze względu na drugą ze zmiennych, tzn. addytywne i jednorodne względem drugiej współrzędnej
    B ( x , y + z ) = B ( x , y ) + B ( x , z ) {\displaystyle B(\mathbf {x} ,\mathbf {y} +\mathbf {z} )=B(\mathbf {x} ,\mathbf {y} )+B(\mathbf {x} ,\mathbf {z} )}
    oraz
    B ( x , c y ) = c B ( x , y ) {\displaystyle B(\mathbf {x} ,c\,\mathbf {y} )=c\,B(\mathbf {x} ,\mathbf {y} )}

Rodzaje form dwuliniowych

Na formy dwuliniowe nakłada się dodatkowe warunki.

Forma refleksyjna

B ( x , y ) = 0 B ( y , x ) = 0 {\displaystyle B(\mathbf {x} ,\mathbf {y} )=0\Leftrightarrow B(\mathbf {y} ,\mathbf {x} )=0}

Forma alternacyjna

B ( x , x ) = 0 {\displaystyle B(\mathbf {x} ,\mathbf {x} )=0}

Forma symetryczna

B ( x , y ) = B ( y , x ) {\displaystyle B(\mathbf {x} ,\mathbf {y} )=B(\mathbf {y} ,\mathbf {x} )}

Forma antysymetryczna

Forma zwana też formą symplektyczną

B ( x , y ) = B ( y , x ) {\displaystyle B(\mathbf {x} ,\mathbf {y} )=-B(\mathbf {y} ,\mathbf {x} )}

Uwagi

(1) Dwuliniowa forma antysymetryczna – to inna nazwa dwuliniowej formy symetrycznej lub alternującej: alternacyjność pociąga antysymetryczność w ciele dowolnej charakterystyki[a].

(2) W przypadku ciała liczb rzeczywistych pojęcia alternacyjności i antysymetryczności pokrywają się, jednak i w tym kontekście nazwa „antysymetryczna” jest nadal używana.

(3) Pojęcia te rozważa się także w modułach nad pierścieniami, gdzie żadne z nich nie musi pociągać pozostałych[b].

Twierdzenia

Tw. 1: Forma dwuliniowa jest refleksywna wtedy i tylko wtedy, gdy jest symetryczna albo alternująca[c].

Tw. 2: W ciele charakterystyki różnej od 2 forma dwuliniowa jest antysymetryczna wtedy i tylko wtedy, gdy jest alternująca, a w ciele charakterystyki 2 forma dwuliniowa jest antysymetryczna wtedy i tylko wtedy, gdy jest symetryczna[d].

Własności

W ciele charakterystyki różnej od 2 każdą formę dwuliniową B {\displaystyle B} można przedstawić jednoznacznie w postaci sumy B s + B a {\displaystyle B_{\mathrm {s} }+B_{\mathrm {a} }} formy symetrycznej B s {\displaystyle B_{\mathrm {s} }} i formy alternującej (antysymetrycznej) B a {\displaystyle B_{\mathrm {a} }} [e]; w przypadku ciała charakterystyki 2 alternujące formy dwuliniowe są podzbiorem symetrycznych form dwuliniowych[f] W ciele charakterystyki różnej od 2 symetryczna forma dwuliniowa B ( x , y ) {\displaystyle B(\mathbf {x} ,\mathbf {y} )} wyznaczona jest całkowicie przez wartości B ( x , x ) {\displaystyle B(\mathbf {x} ,\mathbf {x} )} „na przekątnej”[g] – własność tę nazywa się polaryzacją (w szczególności B 0 B ( x , x ) = 0 ) {\displaystyle B\equiv 0\Leftrightarrow B(\mathbf {x} ,\mathbf {x} )=0)} ). Oznacza to, że badanie tego rodzaju form dwuliniowych sprowadza się do badania form kwadratowych.

Z formą dwuliniową B {\displaystyle B} można związać dwa przekształcenia liniowe B L , B R {\displaystyle B_{\mathrm {L} },B_{\mathrm {R} }} z przestrzeni V {\displaystyle V} w przestrzeń dualną V {\displaystyle V^{*}} dane wzorami

B L ( x ) ( y ) = B ( x , y )  oraz  B R ( y ) ( x ) = B ( x , y ) , {\displaystyle B_{\mathrm {L} }(\mathbf {x} )(\mathbf {y} )=B(\mathbf {x} ,\mathbf {y} )\quad {\mbox{ oraz }}\quad B_{\mathrm {R} }(\mathbf {y} )(\mathbf {x} )=B(\mathbf {x} ,\mathbf {y} ),}

oznaczane często odpowiednio B ( x , ) {\displaystyle B(\mathbf {x} ,\cdot )} oraz B ( , y ) , {\displaystyle B(\cdot ,\mathbf {y} ),} gdzie kropka oznacza miejsce przyłożenia argumentu dla powstałej formy liniowej (por. currying w rachunku lambda).

Przekształcenie B R {\displaystyle B_{\mathrm {R} }} jest transpozycją (sprzężeniem) B L {\displaystyle B_{\mathrm {L} }} na obrazie V {\displaystyle V} w drugiej przestrzeni dualnej V {\displaystyle V^{**}} (i na odwrót). Jeżeli V {\displaystyle V} jest skończeniewymiarowa, to istnieje naturalny izomorfizm między V , {\displaystyle V,} a jej drugą dualną V , {\displaystyle V^{**},} dzięki czemu B R {\displaystyle B_{\mathrm {R} }} można uważać za transpozycję B L {\displaystyle B_{\mathrm {L} }} na V . {\displaystyle V.} W ten sposób dla danej formy dwuliniowej B {\displaystyle B} można zdefiniować jej transpozycję (sprzężenie) B {\displaystyle B^{*}} wzorem

B ( x , y ) = B ( y , x ) . {\displaystyle B^{*}(\mathbf {x} ,\mathbf {y} )=B(\mathbf {y} ,\mathbf {x} ).}

Rząd B L {\displaystyle B_{\mathrm {L} }} jest równy rzędowi B R ; {\displaystyle B_{\mathrm {R} };} nazywa się go rzędem formy dwuliniowej B . {\displaystyle B.} Jeśli rząd tych przekształceń jest pełny (tzn. równy wymiarowi przestrzeni), to B L {\displaystyle B_{\mathrm {L} }} i B R {\displaystyle B_{\mathrm {R} }} są izomorfizmami liniowymi V V . {\displaystyle V\to V^{*}.} Wówczas formę dwuliniową B {\displaystyle B} nazywa się niezdegenerowaną lub nieosobliwą (w przeciwnym przypadku nazywa się ją zdegenerowaną lub osobliwą); podobnie nazywa się wtedy samą przestrzeń dwuliniową ( V , B ) . {\displaystyle (V,B).} Gdy V {\displaystyle V} jest skończeniewymiarowa, na mocy twierdzenia o rzędzie jest to równoważne trywialności jądra B L . {\displaystyle B_{\mathrm {L} }.} Wówczas B {\displaystyle B} jest niezdegenerowana wtedy i tylko wtedy, gdy dla wszystkich y {\displaystyle \mathbf {y} } zachodzi

B ( x , y ) = 0 x = 0 , {\displaystyle B(\mathbf {x} ,\mathbf {y} )=0\Rightarrow \mathbf {x} =\mathbf {0} ,}

bądź (na mocy kontrapozycji) gdy dla każdego niezerowego wektora x {\displaystyle \mathbf {x} } istnieje taki wektor y , {\displaystyle \mathbf {y} ,} dla którego B ( x , y ) 0. {\displaystyle B(\mathbf {x} ,\mathbf {y} )\neq 0.} Własność tę przyjmuje się często jako definicję niezdegenerowania w przypadku przestrzeni skończonego wymiaru[h].

Dla dowolnego przekształcenia A : V V {\displaystyle \mathrm {A} \colon V\to V^{*}} wzór

B ( x , y ) = A ( x ) ( y ) . {\displaystyle B(\mathbf {x} ,\mathbf {y} )=\mathrm {A} (\mathbf {x} )(\mathbf {y} ).}

definiuje formę dwuliniową B {\displaystyle B} na przestrzeni V . {\displaystyle V.} Jest ona niezdegenerowana wtedy i tylko wtedy, gdy A {\displaystyle \mathrm {A} } jest izomorfizmem.

Formy dwuliniowe B 1 {\displaystyle B_{1}} oraz B 2 {\displaystyle B_{2}} określone odpowiednio na V 1 {\displaystyle V_{1}} i V 2 {\displaystyle V_{2}} nazywa się równoważnymi, jeżeli istnieje taki izomorfizm C : V 1 V 2 , {\displaystyle \mathrm {C} \colon V_{1}\to V_{2},} który spełniałby

B 2 ( C ( x ) , C ( y ) ) = B 1 ( x , y ) . {\displaystyle B_{2}{\big (}\mathrm {C} (\mathbf {x} ),\mathrm {C} (\mathbf {y} ){\big )}=B_{1}(\mathbf {x} ,\mathbf {y} ).}

Zapisanie obu form dwuliniowych we współrzędnych oznacza przejście do przestrzeni współrzędnych; powyższa definicja mówi wtedy, że za równoważne uważa się te formy dwuliniowe, dla których istnieje liniowa zamiana zmiennych między ich przedstawieniami (w przypadku form symetrycznych wystarczy zadbać o przejście wartości „na przekątnych”; zob. kolejną sekcję).

Przestrzeń liniową V {\displaystyle V} z formą dwuliniową B {\displaystyle B} tworzy przestrzeń dwuliniową ( V , B ) ; {\displaystyle (V,B);} przestrzeń liniowa z symetryczną formą dwuliniową (tzw. „uogólnionym iloczynem skalarnym”) nazywa się przestrzenią ortogonalną, jeśli jest ona dodatkowo niezdegenerowana, to nazywa się ją przestrzenią unitarną; zaś przestrzeń z niezdegenerowaną formą dwuliniową alternującą to przestrzeń symplektyczna. Z kolei dwie przestrzenie liniowe związane (zwykle niezdegenerowaną) formą dwuliniową tworzą parę dwoistą.

Macierz formy

W przypadku przestrzeni skończonego wymiaru n {\displaystyle n} powyższe własności można przetłumaczyć na język macierzy. Ustalenie bazy E = { e 1 , , e n } {\displaystyle E=\{\mathbf {e} _{1},\dots ,\mathbf {e} _{n}\}} w V {\displaystyle V} oznacza wybranie izomorfizmu V K n {\displaystyle V\to K^{n}} odwzorowującego wektor x {\displaystyle \mathbf {x} } w wektor współrzędnych x E , {\displaystyle \mathbf {x} _{E},} którego współrzędne można zapisać w macierzy jednokolumnowej (tzw. wektorze kolumnowym) X . {\displaystyle \mathbf {X} .} Dzięki temu w zupełnie analogiczny sposób jak ma to miejsce dla przekształceń liniowych i ich macierzy działanie formy dwuliniowej B ( x , y ) {\displaystyle B(\mathbf {x} ,\mathbf {y} )} można zapisać w standardowej notacji macierzowej jako X B Y = X T B Y , {\displaystyle \mathbf {X} \cdot \mathbf {BY} =\mathbf {X} ^{\mathrm {T} }\mathbf {BY} ,} gdzie kropka oznacza standardowy iloczyn skalarny przestrzeni współrzędnych K n . {\displaystyle K^{n}.} Macierz kwadratową

B = [ B ( e i , e j ) ] i j {\displaystyle \mathbf {B} ={\big [}B(\mathbf {e} _{i},\mathbf {e} _{j}){\big ]}_{ij}}

stopnia n {\displaystyle n} nazywa się wtedy macierzą formy dwuliniowej (macierzą funkcjonału dwuliniowego) B {\displaystyle B} w bazie E {\displaystyle E} (w przypadku przestrzeni unitarnej jest to odpowiednik macierzy Grama iloczynu skalarnego wyrażonego w tej bazie)[i]. Jest ona macierzą przekształcenia B R {\displaystyle B_{\mathrm {R} }} przy czym wybór ten jest arbitralny: macierz B {\displaystyle \mathbf {B} } jest macierzą B L {\displaystyle B_{\mathrm {L} }} przy wyborze działania B ( x , y ) = B X Y = ( B X ) T Y . {\displaystyle B(\mathbf {x} ,\mathbf {y} )=\mathbf {BX} \cdot \mathbf {Y} =(\mathbf {BX} )^{\mathrm {T} }\mathbf {Y} .} Przekształceń B L , B R : V V , {\displaystyle B_{\mathrm {L} },B_{\mathrm {R} }\colon V\to V^{*},} w przeciwieństwie do ich macierzy, nie można składać – podejście tłumaczące wynik złożenia macierzy na przekształcenia, a przy tym niewyróżniające żadnego z nich opisano dalej.

W przestrzeni z ustaloną bazą równoważność przedstawień (macierzy) form dwuliniowych wyraża się następująco: jeśli E , F {\displaystyle E,F} są dwiema bazami V , {\displaystyle V,} to macierze B E {\displaystyle \mathbf {B} _{E}} i B F {\displaystyle \mathbf {B} _{F}} przekształcenia dwuliniowego B {\displaystyle B} przystające, tzn.

B F = C T B E C , {\displaystyle \mathbf {B} _{F}=\mathbf {C} ^{\mathrm {T} }\mathbf {B} _{E}\mathbf {C} ,}

gdzie C {\displaystyle \mathbf {C} } oznacza macierz zamiany współrzędnych M ( i d ) E F {\displaystyle \mathrm {M} (\mathrm {id} )_{E}^{F}} od E {\displaystyle E} do F . {\displaystyle F.} Ogólniej: macierze A {\displaystyle \mathbf {A} } i B {\displaystyle \mathbf {B} } są przystające, tzn.

B = C T A C , {\displaystyle \mathbf {B} =\mathbf {C} ^{\mathrm {T} }\mathbf {A} \mathbf {C} ,}

dla pewnej macierzy odwracalnej C , {\displaystyle \mathbf {C} ,} gdy są macierzami tej samej formy dwuliniowej.

Wprost z definicji wynika, że forma dwuliniowa jest symetryczna bądź antysymetryczna wtedy i tylko wtedy, gdy jej macierz jest macierz symetryczna bądź antysymetryczna. Forma dwuliniowa jest alternująca wtedy i tylko wtedy, gdy jej macierz jest antysymetryczna i wszystkie elementy na głównej przekątnej są równe zeru (co wynika z antysymetryczności dla ciał o charakterystyce różnej od 2).

Jeśli macierz B {\displaystyle \mathbf {B} } formy dwuliniowej B {\displaystyle B} jest nieosobliwa (odwracalna), to samą formę B {\displaystyle B} nazywa się niezdegenerowaną lub także nieosobliwą (podobnie mówi się wtedy o samej przestrzeni ( V , B ) {\displaystyle (V,B)} ); w przeciwnym przypadku formę (lub przestrzeń dwuliniową) nazywa się zdegenerowaną lub osobliwą. Rzędem formy dwuliniowej B {\displaystyle B} bądź przestrzeni ( V , B ) {\displaystyle (V,B)} nazywa się rząd macierzy B {\displaystyle \mathbf {B} } tej formy (jest on dobrze określony, gdyż nie zależy od wyboru bazy ze względu na fakt, iż macierze przystające mają równe rzędy).

Przykłady

  • Przestrzeń trywialna (zerowymiarowa) ma jedną formę dwuliniową, która nie ma macierzy (ma macierz pustą, tzn. typu 0 × 0 {\displaystyle 0\times 0} ).
  • Jeśli K n {\displaystyle K^{n}} jest przestrzenią współrzędnych z bazą standardową e 1 , , e n , {\displaystyle \mathbf {e} _{1},\dots ,\mathbf {e} _{n},} to każda forma dwuliniowa B ( x , y ) {\displaystyle B(\mathbf {x} ,\mathbf {y} )} na tej przestrzeni liniowej jest postaci
i , j = 1 n x i y j b i j , {\displaystyle \sum _{i,j=1}^{n}x_{i}y_{j}b_{ij},}
gdzie b i j = B ( e i , e j ) . {\displaystyle b_{ij}=B(\mathbf {e} _{i},\mathbf {e} _{j}).}
  • Jeśli x 0 {\displaystyle x_{0}} jest ustalonym punktem przestrzeni liniowej X {\displaystyle X^{*}} form (funkcjonałów) na X , {\displaystyle X,} to wzór
B ( f , g ) = f ( x 0 ) g ( x 0 ) {\displaystyle B(f,g)=f(x_{0})g(x_{0})}
zadaje formę dwuliniową na tej przestrzeni.
  • Jeśli ( V , B ) {\displaystyle (V,B)} jest przestrzenią dwuliniową, zaś W {\displaystyle W} jest podprzestrzenią V , {\displaystyle V,} to zawężenie B {\displaystyle B} do W {\displaystyle W} daje podprzestrzeń dwuliniową ( W , B | W ) , {\displaystyle (W,B|_{W}),} oznaczaną też po prostu ( W , B ) {\displaystyle (W,B)} (konstrukcję tę można również przeprowadzić za pomocą przestrzeni ilorazowej); podprzestrzeń dziedziczy własności refleksywności, alternacyjności, symetryczności i antysymetryczności z przestrzeni wyjściowej, lecz niekoniecznie jej niezdegenerowania[j]; jeśli K = R , {\displaystyle K=\mathbb {R} ,} zaś B {\displaystyle B} jest dodatnio określona (tzn. B ( x , x ) > 0 {\displaystyle B(\mathbf {x} ,\mathbf {x} )>0} dla dowolnego x 0 {\displaystyle \mathbf {x} \neq 0} ), to własność ta zachodzi dla dowolnej niezerowej podprzestrzeni W V , {\displaystyle W\subseteq V,} skąd B | W {\displaystyle B|_{W}} jest również dodatnio określona, a zatem niezdegenerowana.
  • Jeżeli ( V 1 , B 1 ) {\displaystyle (V_{1},B_{1})} i ( V 2 , B 2 ) {\displaystyle (V_{2},B_{2})} są przestrzeniami dwuliniowymi na tym samym ciałem, to suma prosta V 1 V 2 {\displaystyle V_{1}\oplus V_{2}} wraz z formą dwuliniową ( B 1 B 2 ) ( ( x 1 , x 2 ) , ( y 1 , y 2 ) ) = B 1 ( x 1 , y 1 ) + B 2 ( x 2 , y 2 ) {\displaystyle (B_{1}\oplus B_{2})((\mathbf {x} _{1},\mathbf {x} _{2}),(\mathbf {y} _{1},\mathbf {y} _{2}))=B_{1}(\mathbf {x} _{1},\mathbf {y} _{1})+B_{2}(\mathbf {x} _{2},\mathbf {y} _{2})} staje się podprzestrzenią dwuliniową; jeśli obie formy B 1 {\displaystyle B_{1}} oraz B 2 {\displaystyle B_{2}} są jednocześnie symetryczne, alternujące, antysymetryczne bądź refleksywne, to B 1 B 2 {\displaystyle B_{1}\oplus B_{2}} również ma tę samą własność. Konstrukcję tę nazywa się ortogonalną sumą prostą przestrzeni V 1 {\displaystyle V_{1}} oraz V 2 . {\displaystyle V_{2}.} [k]
  • Jeśli C [ a , b ] {\displaystyle \mathrm {C} [a,b]} oznacza przestrzeń liniową funkcji ciągłych [ a , b ] R , {\displaystyle [a,b]\to \mathbb {R} ,} to funkcja I : C [ a , b ] × C [ a , b ] R {\displaystyle \mathrm {I} \colon \mathrm {C} [a,b]\times \mathrm {C} [a,b]\to \mathbb {R} } dana wzorem
I ( f , g ) = a b f ( x ) g ( x )   d x {\displaystyle \mathrm {I} (f,g)=\int \limits _{a}^{b}f(x)g(x)\ \mathrm {d} x}
definiuje zdegenerowaną formę dwuliniową na tej przestrzeni: nie jest ona surjektywna, gdyż np. forma delta Diraca należy do jej przestrzeni sprzężonej (topologicznie), ale nie ma wymaganej postaci; z drugiej strony forma I {\displaystyle \mathrm {I} } spełnia skończeniewymiarową definicję niezdegenerowania.
  • Każdy iloczyn skalarny na przestrzeni unitarnej jest niezdegenerowaną formą dwuliniową, gdyż jego macierz w dowolnej bazie (macierz Grama) jest odwracalna: wyznacznik układu liniowo niezależnego jest różny od zera bądź wynika to wprost z dodatniej określoności iloczynu skalarnego. Z definicji jest on także symetryczny.
  • Niech dla przestrzeni R n {\displaystyle \mathbb {R} ^{n}} dobrane będą nieujemne liczby całkowite p , q {\displaystyle p,q} spełniające p + q = n . {\displaystyle p+q=n.} Wzór
x , y = x 1 y 1 + + x p y p x p + 1 y p + 1 x n y n , {\displaystyle \langle \mathbf {x} ,\mathbf {y} \rangle =x_{1}y_{1}+\ldots +x_{p}y_{p}-x_{p+1}y_{p+1}-\ldots -x_{n}y_{n},}
gdzie x = ( x 1 , , x n ) {\displaystyle \mathbf {x} =(x_{1},\dots ,x_{n})} oraz y = ( y 1 , , y n ) , {\displaystyle \mathbf {y} =(y_{1},\dots ,y_{n}),} dany jest w notacji macierzowej jako
x , y = X [ I p Θ Θ I q ] Y , {\displaystyle \langle \mathbf {x} ,\mathbf {y} \rangle =\mathbf {X} {\begin{bmatrix}\mathbf {I} _{p}&{\boldsymbol {\Theta }}\\{\boldsymbol {\Theta }}&-\mathbf {I} _{q}\end{bmatrix}}\mathbf {Y} ,}
gdzie X = [ x 1     x n ] {\displaystyle \mathbf {X} =[x_{1}\ \dots \ x_{n}]} oraz Y = [ y 1     y n ] T , {\displaystyle \mathbf {Y} =[y_{1}\ \dots \ y_{n}]^{\mathrm {T} },} zaś I k {\displaystyle \mathbf {I} _{k}} oznacza kwadratową podmacierz jednostkową stopnia k , {\displaystyle k,} a Θ {\displaystyle {\boldsymbol {\Theta }}} oznacza podmacierz zerową, definiuje formę dwuliniową, która czyni z przestrzeni euklidesowej R n {\displaystyle \mathbb {R} ^{n}} tzw. przestrzeń pseudoeuklidesową R p , q . {\displaystyle \mathbb {R} ^{p,q}.} Przypadki R 1 , 3 {\displaystyle \mathbb {R} ^{1,3}} oraz R 3 , 1 {\displaystyle \mathbb {R} ^{3,1}} to modele przestrzeni Minkowskiego[l]. Z twierdzenia Sylvestera o bezwładności form kwadratowych wynika, że każda niezdegenerowana (rezygnując z nieosobliwości dopuszcza się zera na przekątnej), symetryczna forma dwuliniowa ma w pewnej bazie (przestrzeni liniowej nad ciałem charakterystyki różnej od 2) powyższą postać.

Ortogonalność

Za pomocą formy dwuliniowej można wprowadzić pojęcie (uogólnionej) ortogonalności: wektory x {\displaystyle \mathbf {x} } i y {\displaystyle \mathbf {y} } są ortogonalne, co zapisuje się x y , {\displaystyle \mathbf {x} \perp \mathbf {y} ,} względem dwuliniowej formy B {\displaystyle B} wtedy i tylko wtedy, gdy

B ( x , y ) = 0. {\displaystyle B(\mathbf {x} ,\mathbf {y} )=0.}

Dla podprzestrzeni W {\displaystyle W} oraz wektora x {\displaystyle \mathbf {x} } przestrzeni V {\displaystyle V} pisze się x W , {\displaystyle \mathbf {x} \perp W,} jeżeli x w {\displaystyle \mathbf {x} \perp \mathbf {w} } dla wszystkich w {\displaystyle \mathbf {w} } z przestrzeni W ; {\displaystyle W;} podobnie W x {\displaystyle W\perp \mathbf {x} } oraz U W , {\displaystyle U\perp W,} gdzie U {\displaystyle U} jest pewną podprzestrzenią liniową (definicje te rozszerza się często na dowolne podzbiory). Relacja x y {\displaystyle \mathbf {x} \perp \mathbf {y} } nie musi pociągać, ani być pociągana przez y x . {\displaystyle \mathbf {y} \perp \mathbf {x} .} Najważniejszymi formami dwuliniowymi są te, dla których relacja {\displaystyle \perp } jest symetryczna, tzn.

x y y x , {\displaystyle \mathbf {x} \perp \mathbf {y} \Leftrightarrow \mathbf {y} \perp \mathbf {x} ,}

co ma miejsce wtedy i tylko wtedy, gdy forma ją definiująca jest refleksywna (tzn. symetryczna bądź alternująca[c]). Wówczas dla dowolnej podprzestrzeni W {\displaystyle W} można zdefiniować zbiór

W = { x : x y d l a k a z ˙ d e g o y W } {\displaystyle W^{\perp }=\{\mathbf {x} \colon \mathbf {x} \perp \mathbf {y} \mathrm {\;dla\;ka{\dot {z}}dego\;} \mathbf {y} \in W\}} [m]

tworzący przestrzeń liniową (gdyż jest to jądro B L , {\displaystyle B_{\mathrm {L} },} bądź B R {\displaystyle B_{\mathrm {R} }} na mocy symetryczności) nazywaną dalej podprzestrzenią ortogonalną do W {\displaystyle W} [n]; w literaturze częściej spotyka się nazwę „dopełnienie ortogonalne”, choć w ogólnym przypadku wcale nie musi być dopełnieniem, gdyż może się zdarzyć, iż W + W V . {\displaystyle W+W^{\perp }\neq V.} Wektory należące do tej części wspólnej (tzw. podprzestrzeni izotropowej), tzn. wektory x {\displaystyle \mathbf {x} } spełniające x x {\displaystyle \mathbf {x} \perp \mathbf {x} } (prostopadłe do samych siebie), nazywa się izotropowymi; wektory niespełniające tego warunku nazywane są czasem nieizotropowymi bądź anizotropowymi. Zachodzi wzór dim W + dim W = dim V {\displaystyle \dim W+\dim W^{\perp }=\dim V} [o]. Podprzestrzeń ortogonalna jest trywialna (czyli dana przestrzeń nie ma niezerowych wektorów izotropowych), tzn. przestrzeń V {\displaystyle V} jest sumą prostą W W , {\displaystyle W\oplus W^{\perp },} wtedy i tylko wtedy, gdy forma dwuliniowa jest niezdegenerowana (jedynym anizotropowym wektorem przestrzeni unitarnej jest zero, gdyż dodatnia określoność iloczynu skalarnego pociąga jego niezdegenerowanie, zob. przedostatni przykład). Wówczas dla dowolnych podprzestrzeni W 1 , W 2 {\displaystyle W_{1},W_{2}} przestrzeni V {\displaystyle V} jest ( W 1 + W 2 ) = W 1 W 2 {\displaystyle (W_{1}+W_{2})^{\perp }=W_{1}^{\perp }\cap W_{2}^{\perp }} oraz ( W 1 W 2 ) = W 1 + W 2 {\displaystyle (W_{1}\cap W_{2})^{\perp }=W_{1}^{\perp }+W_{2}^{\perp }} i zachodzi również ( W ) = W , {\displaystyle \left(W^{\perp }\right)^{\perp }=W,} zaś podprzestrzeń W {\displaystyle W} jest niezdegenerowana wtedy i tylko wtedy, gdy W {\displaystyle W^{\perp }} jest niezdegenerowana. Warunki V = W W {\displaystyle V=W\oplus W^{\perp }} oraz dim V = dim W + dim W {\displaystyle \dim V=\dim W+\dim W^{\perp }} nie są równoważne – pierwszy pociąga drugi, lecz implikacja odwrotna jest fałszywa: podprzestrzenie W {\displaystyle W} i W {\displaystyle W^{\perp }} mogą mieć nietrywialne przecięcie, choć suma ich wymiarów może uzupełniać się do wymiaru przestrzeni[p]; zgodnie z powyższymi obserwacjami wspomniana równość dotycząca wymiarów jest prawdziwa, gdy V {\displaystyle V} jest niezdegenerowana, a W {\displaystyle W} jest dowolna albo gdy V {\displaystyle V} jest dowolna, a W {\displaystyle W} jest niezdegenerowana.

Układ ( x i ) i {\displaystyle (\mathbf {x} _{i})_{i}} wektorów przestrzeni V {\displaystyle V} nazywa się ortogonalnym, jeżeli dla dowolnych i j {\displaystyle i\neq j} zachodzi x i x j . {\displaystyle \mathbf {x} _{i}\perp \mathbf {x} _{j}.} Dowolny układ ortogonalny wektorów anizotropowych jest liniowo niezależny[q]. W przypadku przestrzeni skończonego wymiaru wyposażonej w symetryczną formę dwuliniową jej bazę nazywa się ortogonalną, jeżeli tworzy ona układ ortogonalny; niech { e 1 , , e n } {\displaystyle \{\mathbf {e} _{1},\dots ,\mathbf {e} _{n}\}} oznacza bazę ortogonalną przestrzeni V . {\displaystyle V.} Geometrycznie stanowi ona rozkład V {\displaystyle V} na ortogonalną sumę prostą W 1 W n {\displaystyle W_{1}\oplus \ldots \oplus W_{n}} prostych W i = K e i . {\displaystyle W_{i}=K\mathbf {e} _{i}.} Pojęcie bazy ortonormalnej, czyli takiej bazy ortogonalnej, dla której B ( e i , e i ) = 1 {\displaystyle B(\mathbf {e} _{i},\mathbf {e} _{i})=1} (znanej z przestrzeni euklidesowych) nie znajduje właściwie zastosowań w ogólnej sytuacji, gdyż może ona po prostu nie istnieć[r]. Każda skończeniewymiarowa przestrzeń ortogonalna nad ciałem charakterystyki różnej od 2 ma bazę ortogonalną (wynika stąd, że każda macierz symetryczna przystaje do macierzy diagonalnej, zob. ostatni przykład; ponadto V {\displaystyle V} jest niezdegenerowana wtedy i tylko wtedy, gdy e i ⊥̸ e i {\displaystyle \mathbf {e} _{i}\not \perp \mathbf {e} _{i}} dane wzorem W W , {\displaystyle W\mapsto W^{\perp },} gdzie P G ( V ) {\displaystyle \mathrm {PG} (V)} oznacza zbiór wszystkich podzbiorów przestrzeni V {\displaystyle V} tworzący przestrzeń rzutową, nazywa się biegunowością ortogonalną na przestrzeni P G ( W ) . {\displaystyle \mathrm {PG} (W).} W ten sposób powstają wszystkie biegunowości ortogonalne, a dwie symetryczne formy dwuliniowe indukują tę samą biegunowość wtedy i tylko wtedy, gdy są równe co do mnożenia przez skalar.

Symplektyczność

Zamieniając warunek symetryczności formy dwuliniowej na alternacyjność można wprowadzić analogon baz ortogonalnych w postaci tzw. baz symplektycznych. Niech dana będzie przestrzeń ( V , B ) {\displaystyle (V,B)} z niezdegenerowaną formą dwuliniową alternującą. Wówczas jej wymiar dim V = 2 m {\displaystyle \dim V=2m} jest dodatnią liczbą parzystą. Bazą symplektyczną przestrzeni V {\displaystyle V} nazywa się układ wektorów e 1 , f 1 , , e m , f m , {\displaystyle \mathbf {e} _{1},\mathbf {f} _{1},\dots ,\mathbf {e} _{m},\mathbf {f} _{m},} który spełnia B ( e i , f i ) = 1 {\displaystyle B(\mathbf {e} _{i},\mathbf {f} _{i})=1} oraz dla której płaszczyzny e i + f i {\displaystyle \langle \mathbf {e} _{i}\rangle +\langle \mathbf {f} _{i}\rangle } są ortogonalne. Ponadto z alternacyjności wynika B ( f i , e i ) = 1. {\displaystyle B(\mathbf {f} _{i},\mathbf {e} _{i})=-1.} Dowolne dwie przestrzenie z niezdegenerowaną formą dwuliniową alternującą są równoważne; w szczególności w przestrzeni ustalonego parzystego wymiaru istnieje tylko jedna niezdegenerowana, alternująca forma dwuliniowa. Formę dwuliniową na K 2 m , {\displaystyle K^{2m},} która ma w bazie standardowej e 1 , f 1 , , e m , f m {\displaystyle \mathbf {e} _{1},\mathbf {f} _{1},\dots ,\mathbf {e} _{m},\mathbf {f} _{m}} macierz złożoną z klatek postaci [ 0 1 1 0 ] {\displaystyle \left[{\begin{smallmatrix}0&1\\-1&0\end{smallmatrix}}\right]} [s] na głównej przekątnej i podmacierzy zerowych Θ {\displaystyle {\boldsymbol {\Theta }}} w pozostałych miejscach, nazywa się standardową formą alternującą bądź formą objętości na tej przestrzeni. W bazie Darboux e 1 , , e m , f 1 , , f m {\displaystyle \mathbf {e} _{1},\dots ,\mathbf {e} _{m},\mathbf {f} _{1},\dots ,\mathbf {f} _{m}} ma ona postać

B = [ Θ I m I m Θ ] , {\displaystyle \mathbf {B} ={\begin{bmatrix}{\boldsymbol {\Theta }}&\mathbf {I} _{m}\\\mathbf {-I} _{m}&{\boldsymbol {\Theta }}\end{bmatrix}},}

gdzie I m {\displaystyle \mathbf {I} _{m}} jest podmacierzą jednostkową stopnia m . {\displaystyle m.}

Jak wspomniano wyżej, pojęcie podprzestrzeni ortogonalnej można również zdefiniować dla form alternujących; podprzestrzeń W {\displaystyle W} nazywa się

  • symplektyczną, jeżeli W W = { 0 } , {\displaystyle W^{\perp }\cap W=\{\mathbf {0} \},} co ma miejsce wtedy i tylko wtedy, gdy B {\displaystyle B} zawężona do W {\displaystyle W} jest niezdegenerowana.
  • izotropową, jeśli W W , {\displaystyle W\subseteq W^{\perp },} co zachodzi wtedy i tylko wtedy, gdy B {\displaystyle B} zawężona do W {\displaystyle W} jest tożsamościowo równa zeru (każda podprzedstrzeń jednowymiarowa jest izotropowa).
  • koizotropową, gdy W W , {\displaystyle W^{\perp }\subseteq W,} czyli wtedy i tylko wtedy, gdy B {\displaystyle B} przeniesiona na przestrzeń ilorazową W / W {\displaystyle W/W^{\perp }} jest niezdegenerowana, co jest równoważne izotropowości W {\displaystyle W^{\perp }} (każda podprzestrzeń kowymiaru 1 jest koizotropowa).
  • Lagrange’a, jeżeli W = W , {\displaystyle W=W^{\perp },} tzn. gdy jest zarazem izotropowa i koizotropowa; w przestrzeniach skończonego wymiaru podprzestrzenie te mają wymiar równy połowie wymiaru V ; {\displaystyle V;} każdą podprzestrzeń izotropową można rozszerzyć tak, by była Lagrange’a (zob. grassmannian Lagrange'a).

Wyznacznik dowolnej nieosobliwej macierzy alternującej (antysymetrycznej) M {\displaystyle \mathbf {M} } nad ciałem K {\displaystyle K} jest kwadratem pewnej liczby z K {\displaystyle K} [t], nazywa się go pfaffianem P f ( M ) {\displaystyle \mathrm {Pf} (\mathbf {M} )} tej macierzy – jest to zatem uniwersalna konstrukcja pierwiastka wyznacznika odwracalnych macierzy alternujących (z dokładnością do znaku[u]). Dla dowolnych macierzy kwadratowych M {\displaystyle \mathbf {M} } i C {\displaystyle \mathbf {C} } parzystego stopnia n {\displaystyle n} zachodzi ponadto

P f ( C T M C ) = det C   P f M , {\displaystyle \mathrm {Pf} \left(\mathbf {C} ^{\mathrm {T} }\mathbf {MC} \right)=\det \mathbf {C} \ \mathrm {Pf} \,\mathbf {M} ,}

gdzie M {\displaystyle \mathbf {M} } jest macierzą alternującą[v]. Dodatkowo P f ( M T ) = ( 1 ) n / 2 P f M . {\displaystyle \mathrm {Pf} \left(\mathbf {M} ^{\mathrm {T} }\right)=(-1)^{n/2}\mathrm {Pf} \,\mathbf {M} .} Jeżeli M {\displaystyle \mathbf {M} } jest nieodwracalna, to P f M = 0 ; {\displaystyle \mathrm {Pf} \,\mathbf {M} =0;} jeśli C {\displaystyle \mathbf {C} } jest macierzą zamiany współrzędnych do bazy standardowej odwracalnej macierzy M {\displaystyle \mathbf {M} } (tzn. M {\displaystyle \mathbf {M} } i C {\displaystyle \mathbf {C} } są takimi macierzami odwracalnymi, że C T M C {\displaystyle \mathbf {C} ^{\mathrm {T} }\mathbf {MC} } jest standardową formą alternującą na przestrzeni), to P f M = 1 / det C . {\displaystyle \mathrm {Pf} \,\mathbf {M} =1/\det \mathbf {C} .}

Iloczyny tensorowe

O formach dwuliniowych na przestrzeni liniowej można myśleć jak o przekształceniach liniowych danej przestrzeni w przestrzeń dualną, co opisano w sekcji o macierzy formy; konstrukcja iloczynu tensorowego umożliwia traktowanie form dwuliniowych jako przekształceń liniowych: na mocy własności uniwersalnej iloczynu tensorowego forma dwuliniowa B {\displaystyle B} na przestrzeni liniowej V {\displaystyle V} nad ciałem K {\displaystyle K} pozostaje we wzajemnie jednoznacznej odpowiedniości z formą liniową V K V K {\displaystyle V\otimes _{K}V\to K} daną wzorem

x y B ( x , y ) . {\displaystyle \mathbf {x} \otimes \mathbf {y} \mapsto B(\mathbf {x} ,\mathbf {y} ).}

Z definicji formy liniowe tworzą przestrzeń dualną; w ten sposób przestrzeń B i l ( V ) {\displaystyle \mathrm {Bil} (V)} form dwuliniowych na V {\displaystyle V} jest naturalnie izomorficzna z ( V K V ) , {\displaystyle (V\otimes _{K}V)^{*},} którą można z kolei w naturalny sposób utożsamiać z V V = ( V ) 2 {\displaystyle V^{*}\otimes V^{*}=\left(V^{*}\right)^{\otimes 2}} poprzez odwzorowanie ( φ ψ ) ( x y ) = φ ( x ) ψ ( y ) . {\displaystyle (\varphi \otimes \psi )(\mathbf {x} \otimes \mathbf {y} )=\varphi (\mathbf {x} )\psi (\mathbf {y} ).} Spojrzenie to tłumaczy zatem, złożeniem których przekształceń liniowych jest mnożenie macierzy form dwuliniowych.

Niech H o m K ( V , W ) {\displaystyle \mathrm {Hom} _{K}(V,W)} oznacza przestrzeń liniową przekształceń liniowych V W . {\displaystyle V\to W.} Przekształceniu dwuliniowemu V × W U , {\displaystyle V\times W\to U,} gdzie U , V , W {\displaystyle U,V,W} są dowolnymi przestrzeniami liniowymi nad ciałem K {\displaystyle K} odpowiada przekształcenie liniowe V K W U , {\displaystyle V\otimes _{K}W\to U,} przy czym zachodzą następujące izomorfizmy naturalne:

H o m K ( V K W , U ) H o m K ( V , H o m K ( W , U ) ) {\displaystyle \mathrm {Hom} _{K}(V\otimes _{K}W,U)\simeq \mathrm {Hom} _{K}{\big (}V,\mathrm {Hom} _{K}(W,U){\big )}}

oraz

H o m K ( V K W , U ) H o m K ( W , H o m K ( V , U ) ) . {\displaystyle \mathrm {Hom} _{K}(V\otimes _{K}W,U)\simeq \mathrm {Hom} _{K}{\big (}W,\mathrm {Hom} _{K}(V,U){\big )}.}

Pierwszy z nich przekształca A H o m K ( V K W , U ) {\displaystyle \mathrm {A} \in \mathrm {Hom} _{K}(V\otimes _{K}W,U)} w x [ y A ( x y ) ] , {\displaystyle \mathbf {x} \mapsto [\mathbf {y} \mapsto \mathrm {A} (\mathbf {x} \otimes \mathbf {y} )],} drugi zaś w y [ x A ( x y ) ] . {\displaystyle \mathbf {y} \mapsto [\mathbf {x} \mapsto \mathrm {A} (\mathbf {x} \otimes \mathbf {y} )].} Jeśli V = W , {\displaystyle V=W,} a U = K {\displaystyle U=K} (ciało taktowane jako jednowymiarowa przestrzeń liniowa nad sobą), to stają się one dwoma różnymi izomorfizmami ( V K V ) {\displaystyle (V\otimes _{K}V)^{*}} na H o m K ( V , V ) , {\displaystyle \mathrm {Hom} _{K}(V,V^{*}),} mianowicie B B L {\displaystyle B\mapsto B_{\mathrm {L} }} oraz B B R . {\displaystyle B\mapsto B_{\mathrm {R} }.}

Dwie szczególne klasy form dwuliniowych, formy symetryczne oraz alternujące, można opisać w języku potęg symetrycznej i zewnętrznej. Forma symetryczna postrzegana jako forma liniowa V K V K {\displaystyle V\otimes _{K}V\to K} jest symetryczna, jeżeli znikają dla niej wszystkie tensory postaci x y y x {\displaystyle \mathbf {x} \otimes \mathbf {y} -\mathbf {y} \otimes \mathbf {x} } i alternująca, jeśli znikają dla niej tensory postaci x x . {\displaystyle \mathbf {x} \otimes \mathbf {x} .} W ten sposób forma dwuliniowa symetryczna może być traktowana jako forma liniowa S y m 2 ( V ) K {\displaystyle \mathrm {Sym} ^{2}(V)\to K} odwzorowująca x y B ( x , y ) , {\displaystyle \mathbf {x} \cdot \mathbf {y} \mapsto B(\mathbf {x} ,\mathbf {y} ),} gdzie kropka oznacza iloczyn symetryczny (wewnętrzny) w S y m 2 ( V ) ; {\displaystyle \mathrm {Sym} ^{2}(V);} formy alternujące utożsamia się z kolei z przekształceniami A l t 2 ( V ) K {\displaystyle \mathrm {Alt} ^{2}(V)\to K} danymi wzorem x y B ( x , y ) , {\displaystyle \mathbf {x} \wedge \mathbf {y} \mapsto B(\mathbf {x} ,\mathbf {y} ),} gdzie {\displaystyle \wedge } oznacza iloczyn alternujący (zewnętrzny). Ponieważ formy liniowe tworzą przestrzeń dualną, to symetryczne formy dwuliniowe są elementami S y m 2 ( V ) , {\displaystyle \mathrm {Sym} ^{2}(V)^{*},} zaś alternujące formy dwuliniowe to elementy A l t 2 ( V ) , {\displaystyle \mathrm {Alt} ^{2}(V)^{*},} przy czym można utożsamić te przestrzenie odpowiednio z drugą potęgą symetryczną S y m 2 ( V ) {\displaystyle \mathrm {Sym} ^{2}(V^{*})} i drugą potęgą zewnętrzną A l t 2 ( V ) {\displaystyle \mathrm {Alt} ^{2}(V^{*})} przestrzeni V . {\displaystyle V^{*}.}

Ponieważ S y m 2 ( V ) {\displaystyle \mathrm {Sym} ^{2}(V)} i A l t 2 ( V ) {\displaystyle \mathrm {Alt} ^{2}(V)} są dobrze określone jako przestrzenie ilorazowe V 2 , {\displaystyle V^{\otimes 2},} to poza ciałem charakterystyki 2 można je utożsamiać z odpowiednimi podprzestrzeniami V 2 , {\displaystyle V^{\otimes 2},} mianowicie pisząc x y + y x {\displaystyle \mathbf {x} \otimes \mathbf {y} +\mathbf {y} \otimes \mathbf {x} } zamiast x y S y m 2 ( V ) {\displaystyle \mathbf {x} \cdot \mathbf {y} \in \mathrm {Sym} ^{2}(V)} oraz x y y x {\displaystyle \mathbf {x} \otimes \mathbf {y} -\mathbf {y} \otimes \mathbf {x} } w miejsce x y A l t 2 ( V ) . {\displaystyle \mathbf {x} \wedge \mathbf {y} \in \mathrm {Alt} ^{2}(V).} W ten sposób V 2 = S y m 2 ( V ) A l t 2 ( V ) {\displaystyle V^{\otimes 2}=\mathrm {Sym} ^{2}(V)\oplus \mathrm {Alt} ^{2}(V)} na mocy wzoru x y = 1 2 ( x y + y x ) + 1 2 ( x y y x ) . {\displaystyle \mathbf {x} \otimes \mathbf {y} ={\tfrac {1}{2}}(\mathbf {x} \otimes \mathbf {y} +\mathbf {y} \otimes \mathbf {x} )+{\tfrac {1}{2}}(\mathbf {x} \otimes \mathbf {y} -\mathbf {y} \otimes \mathbf {x} ).} Zamieniając V {\displaystyle V} na V {\displaystyle V^{*}} otrzymuje się ( V ) 2 = S y m 2 ( V ) A l t 2 ( V ) {\displaystyle \left(V^{*}\right)^{\otimes 2}=\mathrm {Sym} ^{2}(V^{*})\oplus \mathrm {Alt} ^{2}(V^{*})} poza ciałem charakterystyki 2, czyli przedstawienie ogólnej formy dwuliniowej w postaci jednoznacznej sumy form dwuliniowych symetrycznej i antysymetrycznej (zob. własności)[e].

Zastosowania

Teoria form dwuliniowych znajduje zastosowanie w wielu działach matematyki:

Zobacz też

Typy form

Własności

Przykłady form w geometrii

Uwagi

  1. Wynika to z równości 0 = B ( x + y , x + y ) = B ( x , x ) + B ( x , y ) + B ( y , x ) + B ( y , y ) = B ( x , y ) + B ( y , x ) , {\displaystyle 0=B(\mathbf {x} +\mathbf {y} ,\mathbf {x} +\mathbf {y} )=B(\mathbf {x} ,\mathbf {x} )+B(\mathbf {x} ,\mathbf {y} )+B(\mathbf {y} ,\mathbf {x} )+B(\mathbf {y} ,\mathbf {y} )=B(\mathbf {x} ,\mathbf {y} )+B(\mathbf {y} ,\mathbf {x} ),} skąd B ( x , y ) = B ( y , x ) . {\displaystyle B(\mathbf {x} ,\mathbf {y} )=-B(\mathbf {y} ,\mathbf {x} ).}
  2. Jeżeli m 4 {\displaystyle m\geqslant 4} będzie liczbą parzystą, a B = [ m / 2 1 1 m / 2 ] {\displaystyle \mathbf {B} =\left[{\begin{smallmatrix}m/2&1\\-1&m/2\end{smallmatrix}}\right]} jest macierzą formy dwuliniowej B ( x , y ) , {\displaystyle B(\mathbf {x} ,\mathbf {y} ),} która jest antysymetryczna, lecz nie jest ani symetryczna, ani alternująca dla x , y {\displaystyle \mathbf {x} ,\mathbf {y} } z pierścienia Z m 2 {\displaystyle \mathbb {Z} _{m}^{2}} rozpatrywanego jako Z m {\displaystyle \mathbb {Z} _{m}} -moduł.
  3. a b Dostateczność: refleksywność wynika wprost z równości B ( x , y ) = ± B ( y , x ) . {\displaystyle B(\mathbf {x} ,\mathbf {y} )=\pm B(\mathbf {y} ,\mathbf {x} ).} Konieczność: niech v = a y + b z ; {\displaystyle \mathbf {v} =a\mathbf {y} +b\mathbf {z} ;} warunek B ( v , x ) = 0 {\displaystyle B(\mathbf {v} ,\mathbf {x} )=0} daje a B ( y , x ) + b B ( z , x ) = 0 , {\displaystyle aB(\mathbf {y} ,\mathbf {x} )+bB(\mathbf {z} ,\mathbf {x} )=0,} skąd np. a = B ( z , x ) {\displaystyle a=B(\mathbf {z} ,\mathbf {x} )} oraz b = B ( y , x ) ; {\displaystyle b=-B(\mathbf {y} ,\mathbf {x} );} z refleksywności warunek B ( x , v ) = 0 {\displaystyle B(\mathbf {x} ,\mathbf {v} )=0} daje wtedy B ( z , x ) B ( x , y ) = B ( y , x ) B ( x , z ) . {\displaystyle B(\mathbf {z} ,\mathbf {x} )B(\mathbf {x} ,\mathbf {y} )=B(\mathbf {y} ,\mathbf {x} )B(\mathbf {x} ,\mathbf {z} ).} Z podstawienia z = x {\displaystyle \mathbf {z} =\mathbf {x} } otrzymuje się B ( x , x ) B ( x , y ) = B ( y , x ) B ( x , x ) , {\displaystyle B(\mathbf {x} ,\mathbf {x} )B(\mathbf {x} ,\mathbf {y} )=B(\mathbf {y} ,\mathbf {x} )B(\mathbf {x} ,\mathbf {x} ),} co oznacza, że ( ) B ( x , y ) B ( y , x ) {\displaystyle (\star )B(\mathbf {x} ,\mathbf {y} )\neq B(\mathbf {y} ,\mathbf {x} )} pociąga B ( x , x ) = 0 {\displaystyle B(\mathbf {x} ,\mathbf {x} )=0} (podobnie B ( y , y ) = 0 {\displaystyle B(\mathbf {y} ,\mathbf {y} )=0} ). Wystarczy teraz pokazać, że niesymetryczna forma refleksywna jest alternująca; z założenia istnieją więc x 0 , y 0 {\displaystyle \mathbf {x} _{0},\mathbf {y} _{0}} spełniające B ( x 0 , y 0 ) B ( y 0 , x 0 ) , {\displaystyle B(\mathbf {x} _{0},\mathbf {y} _{0})\neq B(\mathbf {y} _{0},\mathbf {x} _{0}),} dla których B ( x 0 , x 0 ) = B ( y 0 , y 0 ) = 0 ; {\displaystyle B(\mathbf {x} _{0},\mathbf {x} _{0})=B(\mathbf {y} _{0},\mathbf {y} _{0})=0;} jeśli B ( x 0 , z ) = B ( z , x 0 ) {\displaystyle B(\mathbf {x} _{0},\mathbf {z} )=B(\mathbf {z} ,\mathbf {x} _{0})} lub B ( y 0 , z ) = B ( z , y 0 ) , {\displaystyle B(\mathbf {y} _{0},\mathbf {z} )=B(\mathbf {z} ,\mathbf {y} _{0}),} to ( ) {\displaystyle (\star )} daje B ( z , z ) = 0 ; {\displaystyle B(\mathbf {z} ,\mathbf {z} )=0;} w przeciwnym przypadku B ( z , x 0 ) B ( x 0 , y 0 ) = B ( y 0 , x 0 ) B ( x 0 , z ) , {\displaystyle B(\mathbf {z} ,\mathbf {x} _{0})B(\mathbf {x} _{0},\mathbf {y} _{0})=B(\mathbf {y} _{0},\mathbf {x} _{0})B(\mathbf {x} _{0},\mathbf {z} ),} czyli B ( x 0 , z ) ( B ( x 0 , y 0 ) B ( y 0 , x 0 ) ) = 0 , {\displaystyle B(\mathbf {x} _{0},\mathbf {z} )(B(\mathbf {x} _{0},\mathbf {y} _{0})-B(\mathbf {y} _{0},\mathbf {x} _{0}))=0,} zatem B ( x 0 , z ) = B ( z , x 0 ) = 0 ; {\displaystyle B(\mathbf {x} _{0},\mathbf {z} )=B(\mathbf {z} ,\mathbf {x} _{0})=0;} analogicznie B ( y 0 , z ) = B ( z , y 0 ) = 0. {\displaystyle B(\mathbf {y} _{0},\mathbf {z} )=B(\mathbf {z} ,\mathbf {y} _{0})=0.} Stąd zaś B ( x 0 , y 0 + z ) = B ( x 0 , y 0 ) B ( y 0 , x 0 ) = B ( y 0 + z , x 0 ) , {\displaystyle B(\mathbf {x} _{0},\mathbf {y} _{0}+\mathbf {z} )=B(\mathbf {x} _{0},\mathbf {y} _{0})\neq B(\mathbf {y} _{0},\mathbf {x} _{0})=B(\mathbf {y} _{0}+\mathbf {z} ,\mathbf {x} _{0}),} dlatego B ( x 0 + z , y 0 + z ) = 0 {\displaystyle B(\mathbf {x} _{0}+\mathbf {z} ,\mathbf {y} _{0}+\mathbf {z} )=0} ze względu na ( ) , {\displaystyle (\star ),} a więc B ( z , z ) = 0. {\displaystyle B(\mathbf {z} ,\mathbf {z} )=0.}
  4. Ponieważ B ( x , x ) = B ( x , x ) , {\displaystyle B(\mathbf {x} ,\mathbf {x} )=-B(\mathbf {x} ,\mathbf {x} ),} to 2 B ( x , x ) = 0 , {\displaystyle 2B(\mathbf {x} ,\mathbf {x} )=0,} a więc w ciele charakterystyki różnej od 2 jest B ( x , x ) = 0 ; {\displaystyle B(\mathbf {x} ,\mathbf {x} )=0;} w ciele charakterystyki 2 zachodzi z kolei 1 = 1. {\displaystyle -1=1.}
  5. a b Dodając i odejmując stronami równości B ( x , y ) = B s ( x , y ) + B a ( x , y ) {\displaystyle B(\mathbf {x} ,\mathbf {y} )=B_{\mathrm {s} }(\mathbf {x} ,\mathbf {y} )+B_{\mathrm {a} }(\mathbf {x} ,\mathbf {y} )} oraz B ( y , x ) = B s ( x , y ) B a ( x , y ) {\displaystyle B(\mathbf {y} ,\mathbf {x} )=B_{\mathrm {s} }(\mathbf {x} ,\mathbf {y} )-B_{\mathrm {a} }(\mathbf {x} ,\mathbf {y} )} otrzymuje się przedstawienia B s ( x , y ) = 1 2 B ( x , y ) + 1 2 B ( y , x ) {\displaystyle B_{\mathrm {s} }(\mathbf {x} ,\mathbf {y} )={\tfrac {1}{2}}B(\mathbf {x} ,\mathbf {y} )+{\tfrac {1}{2}}B(\mathbf {y} ,\mathbf {x} )} oraz B a ( x , y ) = 1 2 B ( x , y ) 1 2 B ( x , y ) . {\displaystyle B_{\mathrm {a} }(\mathbf {x} ,\mathbf {y} )={\tfrac {1}{2}}B(\mathbf {x} ,\mathbf {y} )-{\tfrac {1}{2}}B(\mathbf {x} ,\mathbf {y} ).} Jednoznaczność otrzymuje się z odwrócenia rozumowania.
  6. Wynika to wprost z powyższej uwagi dotyczącej ciał charakterystyki 2.
  7. Zachodzi 2 B ( x , y ) = B ( x , y ) B ( y , x ) = B ( x + y , x + y ) B ( x , x ) B ( y , y ) . {\displaystyle 2B(\mathbf {x} ,\mathbf {y} )=B(\mathbf {x} ,\mathbf {y} )-B(\mathbf {y} ,\mathbf {x} )=B(\mathbf {x} +\mathbf {y} ,\mathbf {x} +\mathbf {y} )-B(\mathbf {x} ,\mathbf {x} )-B(\mathbf {y} ,\mathbf {y} ).}
  8. Czasem nietrywialność jądra nazywana bywa „niezdegenerowaniem”, a pełność rzędu – „nieosobliwością”; w ten sposób niezdegenerowanie nie musi pociągać nieosobliwości.
  9. Jeśli x = i = 1 n x i e i {\displaystyle \mathbf {x} =\sum _{i=1}^{n}x_{i}\mathbf {e} _{i}} i y = j = 1 n y j e j , {\displaystyle \mathbf {y} =\sum _{j=1}^{n}y_{j}\mathbf {e} _{j},} to B ( x , y ) = B ( i = 1 n x i e i , j = 1 n y j e j ) = i , j = 1 n x i y j b i j , {\displaystyle B(\mathbf {x} ,\mathbf {y} )=B\left(\sum _{i=1}^{n}x_{i}\mathbf {e} _{i},\sum _{j=1}^{n}y_{j}\mathbf {e} _{j}\right)=\sum _{i,j=1}^{n}x_{i}y_{j}b_{ij},} gdzie b i j = B ( e i , e j ) . {\displaystyle b_{ij}=B(\mathbf {e} _{i},\mathbf {e} _{j}).}
  10. Kontrprzykład (zob. ostatni przykład): choć przestrzeń R 2 , 1 {\displaystyle \mathbb {R} ^{2,1}} jest niezdegenerowana, to płaszczyzna rozpinana przez wektory x 1 = ( 1 , 0 , 1 ) {\displaystyle \mathbf {x} _{1}=(1,0,1)} oraz x 2 = ( 0 , 1 , 0 ) {\displaystyle \mathbf {x} _{2}=(0,1,0)} w R 2 , 1 {\displaystyle \mathbb {R} ^{2,1}} jest zdegenerowana (czyli zdegenerowane jest zawężenie , 2 , 1 {\displaystyle \langle \cdot ,\cdot \rangle _{2,1}} do tej płaszczyzny), gdyż x 1 x 1 {\displaystyle \mathbf {x} _{1}\perp \mathbb {x} _{1}} oraz x 1 x 2 . {\displaystyle \mathbf {x} _{1}\perp \mathbb {x} _{2}.} Istnieją w R 2 , 1 {\displaystyle \mathbb {R} ^{2,1}} wektory, które nie są prostopadłe do x 1 , {\displaystyle \mathbf {x} _{1},} np. ( 1 , 0 , 0 ) , {\displaystyle (1,0,0),} ale nie leżą one we wspomnianej płaszczyźnie.
  11. Czasami oznacza się ją symbolem V 1 V 2 {\displaystyle V_{1}\perp V_{2}} – odpowiada ona wtedy tzw. zewnętrznej ortogonalnej sumie prostej; symbol ten stosuje się również do oznaczania ortogonalności podprzestrzeni danej przestrzeni (z formami dwuliniowymi z niej indukowanymi) – ogólnie mówi się wówczas o wewnętrznej ortogonalnej sumie prostej; w ogólności symbol {\displaystyle \perp } można stosować względem dowolnych podzbiorów danej przestrzeni, zob. ortogonalność.
  12. Tak jak przestrzeń lokalnie podobną do przestrzeni euklidesowej nazywa się rozmaitością riemannowską (rozmaitość różniczkowa, dla której przestrzeń styczna w każdym jej punkcie wyposażona jest w dodatnio określoną symetryczną formę dwuliniową, tzn. iloczyn skalarny), tak przestrzeń lokalnie podobną do przestrzeni pseudoeuklidesowej nazywa się rozmaitością pseudoriemannowską (rozmaitość różniczkowa, która w dowolnym punkcie ma przestrzeń styczną z niezdegenerowaną, symetryczną formą dwuliniową, tzn. uogólnionym iloczynem skalarnym); odpowiednikiem rozmaitości pseudoriemannowskiej dla niezdegenerowanych alternujących form dwuliniowych (nazywanych też formami symplektycznymi) różniczkowych zamkniętych jest rozmaitość symplektyczna.
  13. Zbiór W {\displaystyle W^{\perp }} definiuje się również jako zbiór { φ V : φ ( x ) = 0 d l a k a z ˙ d e g o x W } , {\displaystyle \{\varphi \in V^{*}\colon \varphi (\mathbf {x} )=0\mathrm {\;dla\;ka{\dot {z}}dego\;} \mathbf {x} \in W\},} wówczas jest on podprzestrzenią w V , {\displaystyle V^{*},} a nie V ; {\displaystyle V;} izomorfizmem między nimi jest zwykle B L {\displaystyle B_{\mathrm {L} }} lub B R . {\displaystyle B_{\mathrm {R} }.}
  14. Pojęcie to jest przypadkiem szczególnym tzw. anihilatora S 0 {\displaystyle S^{0}} danego podzbioru S {\displaystyle S} przestrzeni V {\displaystyle V} bądź radykału R a d ( B ) , {\displaystyle \mathrm {Rad} (B),} czyli zbioru tych x , {\displaystyle \mathbf {x} ,} dla których B ( x , y ) = 0 {\displaystyle B(\mathbf {x} ,\mathbf {y} )=0} dla wszystkich y , {\displaystyle \mathbf {y} ,} który tworzy podprzestrzeń liniową w V ; {\displaystyle V;} w powyższym przypadku zachodzi R a d ( B ) = W 0 = W . {\displaystyle \mathrm {Rad} (B)=W^{0}=W^{\perp }.}
  15. Dla dowolnej niezdegenerowanej, niekoniecznie refleksywnej, formy B {\displaystyle B} oraz podprzestrzeni W {\displaystyle W} przestrzeni V {\displaystyle V} można zdefiniować zbiory W = { x V : x W } {\displaystyle W^{\llcorner }=\{\mathbf {x} \in V\colon \mathbf {x} \perp W\}} oraz W = { x V : W x } , {\displaystyle W^{\lrcorner }=\{\mathbf {x} \in V\colon W\perp \mathbf {x} \},} które mają wymiar równy dim V dim W {\displaystyle \dim V-\dim W} i dla których zachodzi W = W = W . {\displaystyle W^{\llcorner \lrcorner }=W^{\lrcorner \llcorner }=W.}
  16. Niech W {\displaystyle W} oznacza płaszczyznę w przestrzeni pseudoeuklidesowej R 2 , 1 {\displaystyle \mathbb {R} ^{2,1}} (zob. ostatni i czwarty przykład) rozpinaną przez wektory ( 1 , 0 , 1 ) {\displaystyle (1,0,1)} oraz ( 0 , 1 , 0 ) ; {\displaystyle (0,1,0);} ponieważ , 2 , 1 {\displaystyle \langle \cdot ,\cdot \rangle _{2,1}} jest niezdegenerowana na R 2 , 1 , {\displaystyle \mathbb {R} ^{2,1},} to dim W + dim W = 3 , {\displaystyle \dim W+\dim W^{\perp }=3,} skąd W {\displaystyle W^{\perp }} jest jednowymiarowa, a bezpośrednie obliczenia wskazują, iż W = R ( 1 , 0 , 1 ) , {\displaystyle W^{\perp }=\mathbb {R} (1,0,1),} czyli W W , {\displaystyle W\subset W^{\perp },} co oznacza, że R 2 , 1 {\displaystyle \mathbb {R} ^{2,1}} nie jest sumą (prostą) W {\displaystyle W} oraz W , {\displaystyle W^{\perp },} co pozostaje w zgodzie ze zdegenerowaniem podprzestrzeni W {\displaystyle W} w R 2 , 1 . {\displaystyle \mathbb {R} ^{2,1}.}
  17. Jeśli x 1 , , x k {\displaystyle \mathbf {x} _{1},\dots ,\mathbf {x} _{k}} jest układem ortogonalnym, to zakładając i = 1 k a i x i = 0 {\displaystyle \sum _{i=1}^{k}a_{i}\mathbf {x} _{i}=\mathbf {0} } dla każdego j = 1 , , k {\displaystyle j=1,\dots ,k} zachodzi 0 x j ( i = 1 k a i x i ) x j i = 1 k a i ( x i x j ) a j ( x j x j ) , {\displaystyle \mathbf {0} \perp \mathbf {x} _{j}\Leftrightarrow \left(\sum _{i=1}^{k}a_{i}\mathbf {x} _{i}\right)\perp \mathbf {x} _{j}\Leftrightarrow \sum _{i=1}^{k}a_{i}(\mathbf {x} _{i}\perp \mathbf {x} _{j})\Leftrightarrow a_{j}(\mathbf {x} _{j}\perp \mathbf {x} _{j}),} czyli a j = 0. {\displaystyle a_{j}=0.}
  18. Przestrzeń Q 2 {\displaystyle \mathbb {Q} ^{2}} nie ma bazy ortonormalnej względem B ( x , y ) = 2 x 1 y 1 + 3 x 2 y 2 , {\displaystyle B(\mathbf {x} ,\mathbf {y} )=2x_{1}y_{1}+3x_{2}y_{2},} gdyż równanie 2 p 2 + 3 q 2 = 1 {\displaystyle 2p^{2}+3q^{2}=1} nie ma rozwiązań wymiernych, choć { ( 1 , 0 ) ,   ( 0 , 1 ) } {\displaystyle {\big \{}(1,0),\ (0,1){\big \}}} jest bazą ortonormalną przestrzeni R 2 {\displaystyle \mathbb {R} ^{2}} względem tej samej formy B . {\displaystyle B.}
  19. Macierz tej postaci jest macierzą jednostki urojonej w macierzowej reprezentacji liczb zespolonych.
  20. Odpowiadająca tej macierzy niezdegenerowana forma dwuliniowa alternująca B {\displaystyle B} ma w pewnej bazie A {\displaystyle A} postać B A = [ Θ I m I m Θ ] ; {\displaystyle \mathbf {B} _{A}=\left[{\begin{smallmatrix}{\boldsymbol {\Theta }}&\mathbf {I} _{m}\\\mathbf {-I} _{m}&{\boldsymbol {\Theta }}\end{smallmatrix}}\right];} przechodząc do bazy standardowej E {\displaystyle E} otrzymuje się det B E = det C T B A C = ( det C ) 2 B A = 1. {\displaystyle \det \mathbf {B} _{E}=\det \mathbf {C} ^{\mathrm {T} }\mathbf {B} _{A}\mathbf {C} =(\det \mathbf {C} )^{2}\mathbf {B} _{A}=1.}
  21. Często ustala się go w następujący sposób: współczynnik przy m 12 m 34 m 2 m 1   2 m {\displaystyle m_{12}m_{34}\dots m_{2m-1\ 2m}} w P f ( [ m i j ] ) {\displaystyle \mathrm {Pf} ([m_{ij}])} jest równy 1. {\displaystyle 1.}
  22. Wzór ten wynika z równoważności wszystkich niezdegenerowanych form dwuliniowych alternujących na przestrzeni liniowej ustalonego wymiaru.

Bibliografia