QR-Algorithmus

Dieser Artikel behandelt ein Verfahren, das nicht im Zusammenhang mit der Erzeugung des mit derselben Abkürzung benannten QR-Codes steht.

Der QR-Algorithmus ist ein numerisches Verfahren zur Berechnung aller Eigenwerte und eventuell der Eigenvektoren einer quadratischen Matrix. Das auch QR-Verfahren oder QR-Iteration genannte Verfahren basiert auf der QR-Zerlegung und wurde in den Jahren 1961 und 1962 unabhängig voneinander von John G. F. Francis und Wera Nikolajewna Kublanowskaja eingeführt. Ein Vorläufer war der LR-Algorithmus von Heinz Rutishauser (1958), der aber weniger stabil ist und auf der LR-Zerlegung basiert. Oft konvergieren die Iterierten aus dem QR-Algorithmus gegen die Schur-Form der Matrix. Das originale Verfahren ist recht aufwendig und damit – selbst auf heutigen Rechnern – für Matrizen mit hunderttausenden Zeilen und Spalten nicht praktikabel.

Abgeleitete Varianten wie das Multishift-Verfahren von Z. Bai und James Demmel 1989 und die numerisch stabilere Variante von K. Braman, R. Byers und R. Mathias 2002 haben praktische Laufzeiten, die kubisch in der Größe der Matrix sind. Letzteres Verfahren ist in der numerischen Softwarebibliothek LAPACK implementiert, die wiederum in vielen Computeralgebrasystemen (CAS) für die numerischen Matrixalgorithmen verwendet wird.

Beschreibung des QR-Algorithmus

Ziel des Rechenverfahrens

Ausgehend von einer reellen oder komplexen Matrix A R n × n {\displaystyle A\in \mathbb {R} ^{n\times n}} bzw. A C n × n {\displaystyle A\in \mathbb {C} ^{n\times n}} wird eine Folge orthogonaler oder unitärer Matrizen Q 1 , Q 2 , {\displaystyle Q_{1},Q_{2},\dots } bestimmt, so dass die rekursive Matrixfolge A 1 = A , A 2 = Q 1 1 A 1 Q 1 , , A k + 1 = Q k 1 A k Q k , {\displaystyle A_{1}=A,\,A_{2}=Q_{1}^{-1}A_{1}Q_{1},\dots ,A_{k+1}=Q_{k}^{-1}A_{k}Q_{k},\dots } weitestgehend gegen eine obere Dreiecksmatrix konvergiert. Da alle Umformungen in der Rekursion Ähnlichkeitstransformationen sind, haben alle Matrizen der Matrixfolge A 1 , A 2 , {\displaystyle A_{1},A_{2},\dots } dieselben Eigenwerte mit denselben Vielfachheiten.

Wird im Grenzwert eine obere Dreiecksmatrix erreicht, eine Schurform von A {\displaystyle A} , so lassen sich die Eigenwerte aus den Diagonalelementen ablesen. Im Falle einer reellen Matrix mit orthogonalen Umformungen kann es jedoch auch komplexe Eigenwerte geben. Dann ist das Ergebnis des Verfahrens eine obere Blockdreiecksmatrix, deren Diagonalblöcke die Größe 1 {\displaystyle 1} für die reellen Eigenwerte oder die Größe 2 {\displaystyle 2} für komplexe Eigenwerte haben. Einem Eigenwert λ = a + i b {\displaystyle \lambda =a+\mathrm {i} b} und seinem konjugiert komplexen Eigenwert entspricht dabei der Diagonalblock der entsprechenden Drehstreckung ( a b b a ) {\displaystyle \left({\begin{smallmatrix}a&-b\\b&a\end{smallmatrix}}\right)} .

Allgemeines Schema des Verfahrens

Ausgehend von einer Matrix A 1 = A R n × n {\displaystyle A_{1}=A\in \mathbb {R} ^{n\times n}} (bzw. A C n × n {\displaystyle A\in \mathbb {C} ^{n\times n}} ) wird eine Folge von Matrizen A i {\displaystyle A_{i}} nach folgender Vorschrift bestimmt:

  1. for i N {\displaystyle i\in \mathbb {N} } do
  2. Bestimme ein Polynom p i {\displaystyle p_{i}} und werte es in der Matrix A i {\displaystyle A_{i}} aus.
  3. Berechne die QR-Zerlegung von p i ( A i ) = Q i R i {\displaystyle p_{i}(A_{i})=Q_{i}R_{i}} .
  4. Berechne die neue Iterierte: A i + 1 = Q i 1 A i Q i {\displaystyle A_{i+1}=Q_{i}^{-1}A_{i}Q_{i}} .
  5. end for

In dieser allgemeinen Form können auch die Varianten mit (impliziten) Shifts (engl. für Verschiebung) und Mehrfach-Shifts dargestellt und analysiert werden.

Die Matrixfunktion p i {\displaystyle p_{i}} ist oft ein Polynom (hier also eine Linearkombination von Matrixpotenzen) mit reellen (bzw. komplexen) Koeffizienten. Im einfachsten Fall wird ein lineares Polynom gewählt, das dann die Gestalt p i ( A i ) = A i κ i I {\displaystyle p_{i}(A_{i})=A_{i}-\kappa _{i}I} hat. Der Algorithmus vereinfacht sich in diesem Fall auf die klassische Version (mit Einfach-Shift):

  1. for i N {\displaystyle i\in \mathbb {N} } do
  2. Bestimme eine geeignete Zahl κ i {\displaystyle \kappa _{i}}
  3. Berechne die QR-Zerlegung von A i κ i I = Q i R i {\displaystyle A_{i}-\kappa _{i}I=Q_{i}R_{i}}
  4. Berechne die neue Iterierte: A i + 1 = Q i 1 A i Q i = Q i 1 ( Q i R i + κ i I ) Q i = R i Q i + κ i I {\displaystyle A_{i+1}=Q_{i}^{-1}A_{i}Q_{i}=Q_{i}^{-1}(Q_{i}R_{i}+\kappa _{i}I)Q_{i}=R_{i}Q_{i}+\kappa _{i}I}
  5. end for

Wird in jedem Iterationsschritt κ i = 0 {\displaystyle \kappa _{i}=0} gesetzt, so stimmt das Verfahren mit der auf Unterräume (hier den vollen Vektorraum) erweiterten Potenzmethode überein.

Das die QR-Zerlegung steuernde Polynom kann von Anfang an fixiert sein oder dynamisch in jedem Iterationsschritt der aktuellen Matrix A i {\displaystyle A_{i}} angepasst werden. Es gibt auch Versuche, für p i {\displaystyle p_{i}} rationale Matrixfunktionen zu verwenden, d. h. Funktionen der Form p ( A ) = h ( A ) 1 g ( A ) {\displaystyle p(A)=h(A)^{-1}g(A)} mit Polynomen g {\displaystyle g} und h {\displaystyle h} .

Deflation

Ergibt es sich in einem Iterationsschritt, dass ein linksunterer Block aus den Spalten 1 , , i {\displaystyle 1,\dots ,i} und deren Zeilen i + 1 , , n {\displaystyle i+1,\dots ,n} in den Beträgen aller seiner Komponenten eine vorher bestimmte Schwelle unterschreitet, so wird das Verfahren auf den zwei diagonalen quadratischen Teilblöcken der Zeilen/Spalten 1 , , i {\displaystyle 1,\dots ,i} sowie i + 1 , , n {\displaystyle i+1,\dots ,n} separat fortgesetzt. Sind die durch Teilung entstandenen Matrizen klein genug, so kann die Bestimmung der Eigenwerte z. B. mittels Berechnung des charakteristischen Polynoms und dessen Nullstellen beendet werden.

Transformation auf Hessenberg-Form

Das Ziel des QR-Algorithmus ist es, eine obere Dreiecksform oder eine Block-Dreiecksform herzustellen, in der Blöcke der Größe 2 {\displaystyle 2} komplexen Eigenwerten entsprechen. Das kann nahezu auf einfache Weise durch eine Ähnlichkeitstransformation auf Hessenberg-Form, d. h. auf eine Matrix mit nur einer (nicht identisch verschwindenden) unteren Nebendiagonalen, erreicht werden.

  • Setze A ~ = A {\displaystyle {\tilde {A}}=A}
  • für k = 1 {\displaystyle k=1} bis n 1 {\displaystyle n-1} führe aus
  1. Bilde das Spaltensegment u = A ~ k + 1 : n , k {\displaystyle u={\tilde {A}}_{k+1:n,\,k}}
  2. Bestimme die Householder-Spiegelung P ~ k = I 2 v v T {\displaystyle {\tilde {P}}_{k}=I-2vv^{\mathrm {T} }} , die u {\displaystyle u} auf den ersten kanonischen Basisvektor abbildet
  3. Führe mit der Blockmatrix P k = ( I k 0 0 P ~ k ) {\displaystyle P_{k}=\left({\begin{smallmatrix}I_{k}&0\\0&{\tilde {P}}_{k}\end{smallmatrix}}\right)} die Ersetzung von A ~ {\displaystyle {\tilde {A}}} durch die ähnliche Matrix P k 1 A ~ P k = P k A ~ P k {\displaystyle P_{k}^{-1}{\tilde {A}}P_{k}=P_{k}{\tilde {A}}P_{k}} durch.
  • Vermerke die Gesamttransformationsmatrix Q 0 = P 1 P 2 P n 1 {\displaystyle Q_{0}=P_{1}P_{2}\cdots P_{n-1}} .
  • A 1 = A ~ = Q 0 1 A Q 0 {\displaystyle A_{1}={\tilde {A}}=Q_{0}^{-1}AQ_{0}} befindet sich nun in Hessenberg-Form.

Durch die Hessenberg-Form wird die Bestimmung der charakteristischen Polynome von Teilmatrizen erleichtert. Die Hessenberg-Form einer symmetrischen Matrix hat eine Tridiagonalform, was weitere Rechnungen wesentlich beschleunigt.

Weiterhin wird in jedem Schritt des QR-Algorithmus die Hessenberg-Form erhalten. Grundlage hierfür ist die Arithmetik verallgemeinerter Dreiecksmatrizen, bei denen alle Einträge unterhalb einer unteren Nebendiagonalen verschwinden. Eine Hessenberg-Matrix ist demnach eine verallgemeinerte Dreiecksmatrix mit einer Nebendiagonalen. Unter Multiplikation addieren sich die Anzahlen nichtverschwindender Nebendiagonalen, bei Addition bleibt meist die größere Anzahl erhalten.

Daher haben p i ( A i ) {\displaystyle p_{i}(A_{i})} sowie die orthogonale Matrix Q i = p i ( A i ) R i 1 {\displaystyle Q_{i}=p_{i}(A_{i})R_{i}^{-1}} die Anzahl von m = deg p i {\displaystyle m=\deg p_{i}} unteren Nebendiagonalen. Nun gilt wegen A i + 1 = Q i 1 A i Q i {\displaystyle A_{i+1}=Q_{i}^{-1}A_{i}Q_{i}} auch

p i ( A i + 1 ) = Q i 1 p i ( A i ) Q i = R i Q i {\displaystyle p_{i}(A_{i+1})=Q_{i}^{-1}p_{i}(A_{i})Q_{i}=R_{i}Q_{i}} ,

und letzteres Produkt hat ebenfalls m {\displaystyle m} Nebendiagonalen. Das ist im Allgemeinen nur möglich, wenn A i + 1 {\displaystyle A_{i+1}} genau eine Nebendiagonale aufweist, also wieder in Hessenbergform ist. Aus der Zerlegung von p i {\displaystyle p_{i}} in Linearfaktoren folgt (s. unten), dass dies immer der Fall ist.

Man kann darauf aufbauend zeigen (Francis 1962 nach Bai/Demmel), dass schon die erste Spalte x {\displaystyle x} von p i ( A i ) {\displaystyle p_{i}(A_{i})} , die auch proportional zur ersten Spalte von Q i {\displaystyle Q_{i}} ist, die nachfolgende Matrix A i + 1 = Q i 1 A i Q i {\displaystyle A_{i+1}=Q_{i}^{-1}A_{i}Q_{i}} vollständig bestimmt. Genauer: Ist U {\displaystyle U} eine orthogonale Matrix, deren erste Spalte proportional zu x {\displaystyle x} ist, so entsteht A i + 1 {\displaystyle A_{i+1}} , indem die transformierte Matrix U 1 A i U {\displaystyle U^{-1}A_{i}U} wieder in Hessenbergform gebracht wird. Da in x {\displaystyle x} nur die Komponenten der Zeilen 1 , , m + 1 {\displaystyle 1,\ldots ,m+1} von Null verschieden sind, kann U {\displaystyle U} als eine Modifikation der Einheitsmatrix im linksoberen s × s {\displaystyle s\times s} -Block sein, mit einem s > m {\displaystyle s>m} .

Varianten des QR-Algorithmus

Einfache QR-Iteration

Es wird p i ( A ) = A {\displaystyle p_{i}(A)=A} gewählt. Das Verfahren kann dann kurz als QR-Zerlegung A i = Q i R i {\displaystyle A_{i}=Q_{i}R_{i}} gefolgt vom Zusammenmultiplizieren A i + 1 = R i Q i {\displaystyle A_{i+1}=R_{i}Q_{i}} in umgekehrter Reihenfolge angegeben werden. Dieses Verfahren ist die direkte Verallgemeinerung der simultanen Potenzmethode zur Bestimmung der ersten k {\displaystyle k} Eigenwerte einer Matrix. Dieser Zusammenhang wird bei der Unterraumiteration hergeleitet. Indirekt wird auch eine simultane inverse Potenzmethode ausgeführt.

QR-Algorithmus mit einfachen Shifts

Es wird p i ( A ) = A κ i I {\displaystyle p_{i}(A)=A-\kappa _{i}I} gesetzt. Damit kann das Verfahren alternativ auch als QR-Zerlegung A i κ i I = Q i R i {\displaystyle A_{i}-\kappa _{i}I=Q_{i}R_{i}} gefolgt vom um den Shift korrigierten Zusammenmultiplizieren A i + 1 = R i Q i + κ i I {\displaystyle A_{i+1}=R_{i}Q_{i}+\kappa _{i}I} dargestellt werden. Üblicherweise wird versucht, mit dem Shift κ i {\displaystyle \kappa _{i}} den betragskleinsten Eigenwert zu approximieren. Dazu kann das letzte Diagonalelement κ i = ( A i ) n , n {\displaystyle \kappa _{i}=(A_{i})_{n,n}} gewählt werden. Die einfache QR-Iteration ergibt sich, indem alle Shifts zu Null gesetzt werden.

Besitzt A i {\displaystyle A_{i}} Hessenberg-Form, so muss Q i = ( A i κ i I ) R i 1 {\displaystyle Q_{i}=(A_{i}-\kappa _{i}I)R_{i}^{-1}} als Produkt einer Matrix mit und einer Matrix ohne Nebendiagonalen ebenfalls Hessenberg-Form besitzen. Das Gleiche gilt daher auch für A i + 1 = R i Q i + κ i I {\displaystyle A_{i+1}=R_{i}Q_{i}+\kappa _{i}I} . Wird also in Vorbereitung des QR-Algorithmus in A 1 = Q 0 1 A Q 0 {\displaystyle A_{1}=Q_{0}^{-1}AQ_{0}} auf Hessenberg-Form gebracht, so bleibt dies während des gesamten Algorithmus erhalten.

Einfache Shifts für symmetrische Matrizen

Eine symmetrische reelle Matrix A 1 = A {\displaystyle A_{1}=A} hat ausschließlich reelle Eigenwerte. Die Symmetrie bleibt während des QR-Algorithmus in allen A i {\displaystyle A_{i}} erhalten. Für symmetrische Matrizen schlug Wilkinson (1965) vor, denjenigen Eigenwert der rechtsuntersten 2 × 2 {\displaystyle 2\times 2} -Teilmatrix

( a n 1 , n 1 a n 1 , n a n , n 1 a n , n ) {\displaystyle {\begin{pmatrix}a_{n-1,n-1}&a_{n-1,n}\\a_{n,n-1}&a_{n,n}\end{pmatrix}}}

als Shift zu wählen, der näher an a n , n {\displaystyle a_{n,n}} liegt. Wilkinson zeigte, dass die so bestimmte Matrixfolge ( A i ) i N {\displaystyle (A_{i})_{i\in \mathbb {N} }} gegen eine Diagonalmatrix konvergiert, deren Diagonalelemente die Eigenwerte von A = A 1 {\displaystyle A=A_{1}} sind. Die Konvergenzgeschwindigkeit ist dabei quadratisch.

QR-Algorithmus mit doppelten Shifts

Es kann ein Paar von einfachen Shifts in einem Iterationsschritt zusammengefasst werden. In der Konsequenz bedeutet dies, dass für reelle Matrizen auf komplexe Shifts verzichtet werden kann. In der oben angegebenen Notation ist

( A 1 κ 2 I ) ( A 1 κ 1 I ) = ( A 1 κ 2 I ) Q 1 R 1 = Q 1 ( A 2 κ 2 I ) R 1 = Q 1 Q 2 R 2 R 1 {\displaystyle (A_{1}-\kappa _{2}I)(A_{1}-\kappa _{1}I)=(A_{1}-\kappa _{2}I)Q_{1}R_{1}=Q_{1}(A_{2}-\kappa _{2}I)R_{1}=Q_{1}Q_{2}R_{2}R_{1}}

eine QR-Zerlegung für das quadratische Polynom p 1 ( x ) = x 2 ( κ 1 + κ 2 ) x + κ 1 κ 2 {\displaystyle p_{1}(x)=x^{2}-(\kappa _{1}+\kappa _{2})x+\kappa _{1}\kappa _{2}} , ausgewertet in A 1 {\displaystyle A_{1}} . Die Koeffizienten dieses Polynoms sind auch für ein konjugiertes Paar komplexer Shifts reell. Somit können auch komplexe Eigenwerte reeller Matrizen approximiert werden, ohne dass in der Rechnung komplexe Zahlen auftauchen.

Eine übliche Wahl für diesen Doppelshift besteht aus den Eigenwerten der rechtsuntersten 2 × 2 {\displaystyle 2\times 2} -Teilmatrix, d. h., das quadratische Polynom ist das charakteristische Polynom dieses Blocks,

p i ( x ) = x 2 ( a n 1 , n 1 + a n , n ) x + a n 1 , n 1 a n , n a n 1 , n a n , n 1 {\displaystyle p_{i}(x)=x^{2}-(a_{n-1,n-1}+a_{n,n})x+a_{n-1,n-1}a_{n,n}-a_{n-1,n}a_{n,n-1}} .

QR-Algorithmus mit multiplen Shifts

Es wird eine Zahl m {\displaystyle m} größer 2 {\displaystyle 2} , aber wesentlich kleiner als die Größe n {\displaystyle n} der Matrix A {\displaystyle A} festgelegt. Das Polynom p i ( x ) {\displaystyle p_{i}(x)} kann als das charakteristische Polynom der rechtsuntersten quadratischen m × m {\displaystyle m\times m} -Teilmatrix der aktuellen Matrix A i {\displaystyle A_{i}} gewählt werden. Eine andere Strategie besteht darin, die s > m {\displaystyle s>m} Eigenwerte der rechtsuntersten s × s {\displaystyle s\times s} -Teilmatrix zu bestimmen und die m {\displaystyle m} betragskleinsten Eigenwerte s 1 , , s m {\displaystyle s_{1},\dots ,s_{m}} darunter auszuwählen. Mit diesen wird dann eine QR-Zerlegung von

p i ( A i ) = ( A i s 1 I ) ( A i s 2 I ) ( A i s m I ) = Q i R i {\displaystyle p_{i}(A_{i})=(A_{i}-s_{1}I)(A_{i}-s_{2}I)\cdots (A_{i}-s_{m}I)=Q_{i}R_{i}} und A i + 1 = Q i 1 A i Q i {\displaystyle A_{i+1}=Q_{i}^{-1}A_{i}Q_{i}}

bestimmt.

Mit einem Multishift-Verfahren wird oft erreicht, dass die Komponenten des linksunteren ( n m + 1 , , n ) × ( 1 , , n m ) {\displaystyle (n-m+1,\dots ,n)\times (1,\dots ,n-m)} -Blocks in der Folge der iterierten Matrizen besonders schnell klein werden und somit eine Aufspaltung des Eigenwertproblems erreicht wird.

Implizite Multishift-Iteration

Das Zusammenfassen mehrfacher Shifts in der allgemeinen Form ist sehr aufwendig. Wie oben angesprochen, kann der Aufwand dadurch verringert werden, dass in einem vorbereitenden Schritt in A 1 = Q 0 1 A Q 0 {\displaystyle A_{1}=Q_{0}^{-1}AQ_{0}} die Hessenberg-Form hergestellt wird. Da jeder Multishift-Schritt aus einzelnen (auch komplexen) Shifts zusammengesetzt werden kann, bleibt die Hessenberg-Form während des gesamten Algorithmus erhalten.

Dadurch kann der QR-Algorithmus in einen „Bulge-chasing“-Algorithmus umgewandelt werden, der eine Delle in der Hessenbergform am oberen Diagonalenende erzeugt und diese dann die Diagonale herunter und am unteren Ende aus der Matrix „jagt“.

  1. for j N 0 {\displaystyle j\in \mathbb {N} _{0}} do
  2. Berechne das Polynom p ( x ) {\displaystyle p(x)} nach einer der angegebenen Varianten,
  3. Bestimme den Vektor x = p ( A j ) e 1 {\displaystyle x=p(A_{j})e_{1}} .
  4. Bestimme eine Spiegelung von x {\displaystyle x} auf den ersten Einheitsvektor. Da in x {\displaystyle x} nur die ersten m + 1 {\displaystyle m+1} Komponenten nicht verschwinden, hat diese Spiegelung eine einfache Blockgestalt.
  5. Bilde die Matrix A ~ = U 1 A j U {\displaystyle {\tilde {A}}=U^{-1}A_{j}U} und transformiere sie so, dass A j + 1 = Q 1 U 1 A j U Q {\displaystyle A_{j+1}=Q^{-1}U^{-1}A_{j}UQ} wieder in Hessenberg-Form ist.
  6. end for

Wird Q {\displaystyle Q} aus Householder-Spiegelungen zusammengesetzt, Q = P 1 P 2 P n 1 {\displaystyle Q=P_{1}P_{2}\cdots P_{n-1}} , so haben diese Blockdiagonalgestalt P k = d i a g ( I k , P ~ k , I max ( 0 , n k m ) ) {\displaystyle P_{k}=\mathrm {diag} (I_{k},{\tilde {P}}_{k},I_{\max(0,n-k-m)})} .

Anmerkungen zur Funktionsweise

Ähnlichkeitstransformationen

Die im QR-Algorithmus berechneten Matrizen sind zueinander unitär ähnlich, da aufgrund von A i κ i I = Q i R i R i = Q i H ( A i κ i I ) {\displaystyle A_{i}-\kappa _{i}I=Q_{i}R_{i}\quad \Leftrightarrow \quad R_{i}=Q_{i}^{H}(A_{i}-\kappa _{i}I)}

A i + 1 = R i Q i + κ i I = Q i H ( A i κ i I ) Q i + κ i I = Q i H A i Q i κ i Q i H Q i + κ i I = Q i H A i Q i {\displaystyle A_{i+1}=R_{i}Q_{i}+\kappa _{i}I=Q_{i}^{H}(A_{i}-\kappa _{i}I)Q_{i}+\kappa _{i}I=Q_{i}^{H}A_{i}Q_{i}-\kappa _{i}Q_{i}^{H}Q_{i}+\kappa _{i}I=Q_{i}^{H}A_{i}Q_{i}}

gilt. Damit haben alle Matrizen A i {\displaystyle A_{i}} dieselben Eigenwerte (mit der algebraischen und geometrischen Vielfachheit gezählt).

Wahl der Shifts, Konvergenz

Eine einfache, aber nicht sehr effektive Wahl ist die Wahl von Shifts identisch Null. Die Iterierten A i {\displaystyle A_{i}} des resultierenden Algorithmus, des QR-Algorithmus in der Grundform, konvergieren teilweise, wenn sich alle Eigenwerte dem Betrage nach unterscheiden, gegen eine obere Dreiecksmatrix mit den Eigenwerten auf der Diagonalen. Teilweise Konvergenz bedeutet hier, dass die Elemente des unteren Dreiecks von A i {\displaystyle A_{i}} gegen Null gehen und die Diagonalelemente gegen die Eigenwerte. Über die Elemente im oberen Dreieck wird also nichts ausgesagt.

Werden die Shifts als das Matrixelement unten rechts der aktuellen Iterierten gewählt, also κ i = a n n ( i ) {\displaystyle \kappa _{i}=a_{nn}^{(i)}} , so konvergiert der Algorithmus unter geeigneten Umständen quadratisch oder sogar kubisch. Dieser Shift ist als Rayleigh-Quotienten-Shift bekannt, da er über die Inverse Iteration mit einem Rayleigh-Quotienten im Zusammenhang steht.

Bei der Rechnung im Reellen ( A R n × n {\displaystyle A\in \mathbb {R} ^{n\times n}} ) möchte man die reelle Schur-Form berechnen und trotzdem mit konjugiert komplexen Eigenwerten arbeiten können. Dazu gibt es verschiedene Shift-Strategien.

Eine Erweiterung von einfachen Shifts ist der nach James Hardy Wilkinson benannte Wilkinson-Shift. Für den Wilkinson-Shift wird der näher am letzten Matrixelement liegende Eigenwert der letzten 2 × 2 {\displaystyle 2\times 2} Hauptunterabschnittsmatrix

( a n 1 , n 1 ( i ) a n 1 , n ( i ) a n , n 1 ( i ) a n , n ( i ) ) {\displaystyle {\begin{pmatrix}a_{n-1,n-1}^{(i)}&a_{n-1,n}^{(i)}\\a_{n,n-1}^{(i)}&a_{n,n}^{(i)}\end{pmatrix}}}

verwendet.

Der QR-Algorithmus als Erweiterung der Potenzmethode

Zur Analyse des Algorithmus werden die zusätzlichen Matrixfolgen der kumulierten Produkte Q ~ k = Q 1 Q 2 Q k {\displaystyle {\tilde {Q}}_{k}=Q_{1}Q_{2}\cdots Q_{k}} und R ~ k = R k R k 1 R 2 R 1 {\displaystyle {\tilde {R}}_{k}=R_{k}R_{k-1}\cdots R_{2}R_{1}} , k N {\displaystyle k\in \mathbb {N} } definiert. Dabei sind die Produkte Q ~ k {\displaystyle {\tilde {Q}}_{k}} von orthogonalen bzw. unitären Matrizen wieder orthogonale bzw. unitäre Matrizen, genauso sind die Produkte R ~ k {\displaystyle {\tilde {R}}_{k}} von rechtsoberen Dreiecksmatrizen wieder rechtsobere Dreiecksmatrizen. Die Matrizen der QR-Iteration ergeben sich durch Ähnlichkeitstransformationen aus A {\displaystyle A} , denn

A 1 = A , A 2 = R 1 Q 1 = Q 1 1 A 1 Q 1 , A 3 = Q 2 1 A 2 Q 2 = Q ~ 2 1 A Q ~ 2 , , A k = Q ~ k 1 A Q ~ k , {\displaystyle A_{1}=A,\;A_{2}=R_{1}Q_{1}=Q_{1}^{-1}A_{1}Q_{1},\;A_{3}=Q_{2}^{-1}A_{2}Q_{2}={\tilde {Q}}_{2}^{-1}A{\tilde {Q}}_{2},\dots ,\;A_{k}={\tilde {Q}}_{k}^{-1}A{\tilde {Q}}_{k},\dots } .

Daraus folgert man auf QR-Zerlegungen der Potenzen von A {\displaystyle A} :

A = Q 1 R 1 = Q ~ 1 R ~ 1 A 2 = A Q 1 R 1 = Q 1 A 2 R 1 = Q 1 Q 2 R 2 R 1 = Q ~ 2 R ~ 2 A k = A Q ~ k 1 R ~ k 1 = Q ~ k 1 A k R ~ k 1 = Q ~ k 1 Q k R k R ~ k 1 = Q ~ k R ~ k {\displaystyle {\begin{aligned}A=&&&Q_{1}R_{1}&=&{\tilde {Q}}_{1}{\tilde {R}}_{1}\\A^{2}=&AQ_{1}R_{1}=Q_{1}A_{2}R_{1}&=&Q_{1}Q_{2}R_{2}R_{1}&=&{\tilde {Q}}_{2}{\tilde {R}}_{2}\\\vdots &\\A^{k}=&A{\tilde {Q}}_{k-1}{\tilde {R}}_{k-1}={\tilde {Q}}_{k-1}A_{k}{\tilde {R}}_{k-1}&=&{\tilde {Q}}_{k-1}Q_{k}R_{k}{\tilde {R}}_{k-1}&=&{\tilde {Q}}_{k}{\tilde {R}}_{k}\end{aligned}}}

Es werden also im Verlaufe des Algorithmus implizit QR-Zerlegungen der Potenzen der Matrix A {\displaystyle A} bestimmt. Aufgrund der Form dieser Zerlegungen gilt, dass für jedes j = 1 , 2 , , n {\displaystyle j=1,2,\ldots ,n} die ersten j {\displaystyle j} Spalten der Matrix A k {\displaystyle A^{k}} denselben Unterraum aufspannen wie die ersten j {\displaystyle j} Spalten der Matrix Q ~ k {\displaystyle {\tilde {Q}}_{k}} ; zusätzlich sind die Spalten von Q ~ k {\displaystyle {\tilde {Q}}_{k}} orthonormal zueinander. Dieses jedoch ist genau die Situation nach dem k {\displaystyle k} -ten Schritt einer simultanen Potenziteration. Die Diagonalelemente von R k {\displaystyle R_{k}} sind wegen A Q ~ k 1 = Q ~ k R k {\displaystyle A{\tilde {Q}}_{k-1}={\tilde {Q}}_{k}R_{k}} die Approximationen der Eigenwerte von A {\displaystyle A} . Daher lassen sich die Konvergenzeigenschaften der Potenziteration übertragen:

Der einfache QR-Algorithmus konvergiert nur, wenn alle Eigenwerte in ihren Beträgen voneinander verschieden sind. Sind die Eigenwerte nach

| λ 1 | < | λ 2 | < < | λ n | {\displaystyle |\lambda _{1}|<|\lambda _{2}|<\dots <|\lambda _{n}|}

sortiert, so ist die Konvergenzgeschwindigkeit linear mit einem Kontraktionsfaktor, der dem Minimum der Quotienten | λ k | | λ k + 1 | {\displaystyle {\tfrac {|\lambda _{k}|}{|\lambda _{k+1}|}}} entspricht.

Insbesondere für reelle Matrizen kann dieser Algorithmus nur konvergieren, wenn alle Eigenwerte reell sind (da sonst konjugiert komplexe Paare mit gleichem Betrag existieren würden). Diese Situation ist für alle symmetrischen Matrizen gegeben.

Der QR-Algorithmus als simultane inverse Potenziteration

Falls A {\displaystyle A} invertierbar ist, gilt für die Transponierte (für komplexe Matrizen die hermitesch Adjungierte) der Inversen von A {\displaystyle A} und alle ihre Potenzen

( A T ) k = ( A k ) T = ( R ~ k 1 Q ~ k 1 ) T = Q ~ k R ~ k T {\displaystyle (A^{-T})^{k}=(A^{k})^{-T}=({\tilde {R}}_{k}^{-1}{\tilde {Q}}_{k}^{-1})^{T}={\tilde {Q}}_{k}{\tilde {R}}_{k}^{-T}}

Die Inverse einer rechtsoberen Dreiecksmatrix ist wieder eine rechtsobere Dreiecksmatrix, deren Transponierte eine linksuntere Dreiecksmatrix. Damit bestimmt der QR-Algorithmus auch eine QL-Zerlegung der Potenzen von A T {\displaystyle A^{-T}} . Aus der Form dieser Zerlegung ist klar, dass für jedes j = 1 , 2 , , n {\displaystyle j=1,2,\ldots ,n} die letzten j {\displaystyle j} Spalten von Q ~ k {\displaystyle {\tilde {Q}}_{k}} denselben Unterraum aufspannen wie die letzten j {\displaystyle j} Spalten von ( A T ) k {\displaystyle (A^{-T})^{k}} . In der letzten Spalte von Q ~ k {\displaystyle {\tilde {Q}}_{k}} wird somit eine inverse Potenziteration für A T {\displaystyle A^{T}} durchgeführt, diese Spalte konvergiert also gegen den dualen Eigenvektor zum kleinsten Eigenwert von A {\displaystyle A} . Im Produkt Q ~ k T A Q ~ k = A k {\displaystyle {\tilde {Q}}_{k}^{T}A{\tilde {Q}}_{k}=A_{k}} ist also die linke untere Komponente ( A k ) n n {\displaystyle (A_{k})_{nn}} der sog. Rayleigh-Quotient der inversen Potenziteration. Die Konvergenzeigenschaften sind analog zum oben angegebenen.

  • LP: QR-Verfahren für allgemeine EWP, Georg-August-Universität Göttingen

Literatur

  • Gisela Engeln-Müllges, Klaus Niederdrenk, Reinhard Wodicka: Numerik-Algorithmen. 10. Auflage. Springer-Verlag, Berlin, Heidelberg 2011, ISBN 978-3-642-13472-2, Abschnitt 7.6 'Bestimmung der Eigenwerte positiv definiter, symmetrischer, tridiagonaler Matrizen mit Hilfe des QD-Algorithmus' und 7.7 'Transformationen auf Hessenbergform, LR- und QR-Verfahren'. 
  • J. G. F. Francis (1961): The QR Transformation: A Unitary Analogue to the LR Transformation—Part 1. The Computer Journal Vol. 4(3), S. 265–271. doi:10.1093/comjnl/4.3.265
  • J. G. F. Francis (1962): The QR Transformation—Part 2. The Computer Journal 1962 4(4):332-345; (online)
  • David S. Watkins (1982): Understanding the QR algorithm, SIAM Review, Vol. 24, S. 427–440 (JSTOR)
  • Z. Bai; J. Demmel (1989): On a block implementation of Hessenberg multishift QR iteration, International Journal of High Speed Computing, Vol. 1(1), S. 97–112. (siehe LAPACK Working Notes)
  • A. A. Dubrulle; G. H. Golub (1994): A multishift QR iteration without computation of the shifts. Numerical Algorithms, Vol 7, S. 173–181
  • K. Braman; R. Byers; R. Mathias (2002): The Multishift QR Algorithm. Part I: Maintaining Well-Focused Shifts and Level 3 Performance (PDF; 224 kB). SIAM Journal on Matrix Analysis and Applications, Vol. 23, No. 4, S. 929–947
  • K. Braman; R. Byers; R. Mathias (2002): The Multishift QR Algorithm. Part II: Aggressive Early Deflation (PDF; 265 kB). SIAM Journal on Matrix Analysis and Applications, Vol. 23, No. 4, S. 948–989
  • David S. Watkins : The QR algorithm revisited (PDF; 417 kB) , SIAM Review, Vol. 50, No. 1, S. 133–145
  • M. Hermann: Numerische Mathematik, Band 1: Algebraische Probleme. 4., überarbeitete und erweiterte Auflage. Walter de Gruyter Verlag, Berlin und Boston 2020. ISBN 978-3-11-065665-7.