0 Daumen
1,5k Aufrufe

Hallo Community,

ich habe Probleme mit dem Verständnis dieses Themas. Leider finde ich auch im Netz keine großartigen Erklärungen die mich in meinem Fall weiterbringen. Kann mir da jemand helfen die Zusammenhänge zu verstehen und mir das Thema etwas näher erläutern. Falls möglich Ansätze zu dieser Aufgabe wären super mit Erklärungen :)

Aufgabe:

Es sei \( A=\left(\begin{array}{ccc}{i-1} & {1+i} & {i} \\ {3 i-1} & {0} & {1} \\ {0} & {1} & {1-i} \\ {2} & {i} & {2 i}\end{array}\right) \in \mathbb{C}^{4 \times 3} \) und \( b=\left(\begin{array}{c}{4 i} \\ {0} \\ {-4} \\ {4}\end{array}\right) \in \mathbb{C}^{4} \)
Bestimmen sie \( x \in \mathbb{C}^{3} \) so, dass \( \|A x-b\| \) minimal ist. \( \quad \) Hinweis: Normalengleichung lösen.


Lieben Gruß

Knax

Avatar von

Hat das nicht mit dem Problem der kleinsten Quadrate zu tun?

1 Antwort

+5 Daumen
 
Beste Antwort

Aloha :)

Ich versuche mal eine anschauliche Erklärung anhand eines einfachen Beispiels, bevor wir uns deinem konkreten Problem zuwenden. Wir betrachten folgende 3 Gleichungen mit 2 Variablen: $$2x-y=2\quad;\quad x+2y=1\quad;\quad x+y=4$$Du hast mehr Gleichungen als Variablen, solche Gleichungssysteme heißen "überbestimmt" und sind in der Regel nicht exakt lösbar. Du könntest \(x\) und \(y\) so bestimmen, dass 2 Gleichungen exakt gelöst werden, die dritte mit diesen \(x\)- und \(y\)-Werten aber völlig daneben liegt. Besser wäre es, eine Näherungslösung zu finden, die alle 3 Gleichungen "möglichst gut" erfüllt. Wenn z.B. \(x_0=1,4\) und \(y_0=0,5\) gewählt werden, erhalten wir folgende Abweichungen \(r_i\):$$2x_0-y_0=2\,\underbrace{+\,0,3}_{r_1}\quad;\quad x_0+2y_0=1\,\underbrace{+\,1,4}_{=r_2}\quad;\quad x_0+y_0=4\,\underbrace{-2,1}_{=r_3}$$Um diese Abweichungen \(r_i\) zu minimieren, setzen wir das Problem nun auf eine geometrische Ebene. Dazu schreiben wir die 3 Gleichungen in Matrix-Schreibweise auf:$$\underbrace{\left(\begin{array}{c}2 & -1\\1 & 2\\1 & 1\end{array}\right)}_{=:A}\cdot\underbrace{\left(\begin{array}{c}x\\y\end{array}\right)}_{=:\vec x}=\underbrace{\left(\begin{array}{c}2\\1\\4\end{array}\right)}_{=:\vec b}\quad\text{nicht lösbar!}$$Nicht lösbar ist das System deswegen, weil sich der Vektor \(b\) nicht als Linearkombination der Spaltenvektoren von \(A\) schreiben lässt. Mit dem Trick von oben addieren wir auf der rechten Seite einen "Rest-Vektor" \(\vec r\), den wir so wählen können, dass sich die komplette rechte Seite \(\vec b+\vec r\) als Linearkombination der Spaltenvektoren von \(A\) schreiben lässt:$$\underbrace{\left(\begin{array}{c}2 & -1\\1 & 2\\1 & 1\end{array}\right)}_{=A}\cdot\underbrace{\left(\begin{array}{c}x\\y\end{array}\right)}_{=\vec x}=\underbrace{\left(\begin{array}{c}2\\1\\4\end{array}\right)}_{=\vec b}+\underbrace{\left(\begin{array}{c}r_1\\r_2\\r_3\end{array}\right)}_{=:\vec r}$$Geometrisch bedeutet dies Folgendes. Der Vektor \(\vec b\) liegt außerhalb der (Hyper-)Ebene, die durch die Spaltenvektoren von \(A\) aufgespannt wird. Durch Addition eines geeigneten Vektors \(\vec r\) zu \(\vec b\) können wir jedoch bewirken, dass der Summenvektor \(\vec b+\vec r\) in dieser (Hyper-)Ebene liegt. Für \(\vec r\) muss dafür nur$$\vec r=A\vec x-\vec b$$gelten, ansonsten können wir ihn noch frei wählen. Die Idee hinter der Normalengleichung ist nun, diesen Vektor \(\vec r\) "möglichst kurz" zu wählen. Der Vektor \(\vec r\) ist genau dann am kürzesten, wenn er senkrecht auf der (Hyper-)Ebene steht, die durch die Spaltenvektoren von \(A\) aufgespannt wird. Aus Sicht des Endpunktes von \(\vec b\) geht es dann nämlich direkt senkrecht in Richtung (Hyper-)Ebene. Wenn der Vektor \(\vec r\) aber senkrecht auf dieser (Hyper-)Ebene steht, dann steht er auch senkrecht auf allen Spaltenvektoren von \(A\), die diese (Hyper-)Ebene aufspannen. Das Skalarprodukt aus allen Spaltenvektoren von \(A\) und \(\vec r\) muss also \(0\) sein. Bei der Matrix-Multiplikation heißt es "Zeile mal Spalte", daher können wir die Matrix \(A\) zu \(A^T\) transponieren und die gefundene Bedinung in der Form \(A^T\cdot\vec r=\vec 0\) formulieren. Das bedeutet:$$A^T\vec r=\vec 0\quad\Leftrightarrow\quad A^T(A\vec x-\vec b)=\vec 0\quad\Leftrightarrow\quad A^TA\vec x=A^T\vec b$$Ich hoffe, diese Beschreibung hat dir beim Verständnis etwas geholfen. Falls nicht, frag bitte einfach noch, was dir unklar ist.

In deinem Problem tauchen komplexe Zahlen auf. Das funktioniert genauso wie oben beschrieben, jedoch mit der adjungierten Matrix anstelle der transponierten Matrix (weil das Skalarprodukt im Komplexen entsprechend definiert ist):$$A\vec x=\vec b\quad;\quad A=\left(\begin{array}{c}{i-1} & {1+i} & {i} \\ {3 i-1} & {0} & {1} \\ {0} & {1} & {1-i} \\ {2} & {i} & {2 i}\end{array}\right)\quad;\quad\vec b=\left(\begin{array}{c}{4 i} \\ {0} \\ {-4} \\ {4}\end{array}\right)$$$$A^+A=\left(\begin{array}{c}{-i-1} & {-3i-1} & {0} & {2} \\ {1-i} & {0} & {1} & {-i}\\ {-i} & {1} & {1+i} & {-2i}\end{array}\right)\left(\begin{array}{c}{i-1} & {1+i} & {i} \\ {3 i-1} & {0} & {1} \\ {0} & {1} & {1-i} \\ {2} & {i} & {2 i}\end{array}\right)$$$$\phantom{A^+A}=\left(\begin{array}{c}16 & 0 & 0\\0 & 4 & 4\\0 & 4 & 8\end{array}\right)$$$$A^+\vec b=\left(\begin{array}{c}{-i-1} & {-3i-1} & {0} & {2} \\ {1-i} & {0} & {1} & {-i}\\ {-i} & {1} & {1+i} & {-2i}\end{array}\right)\left(\begin{array}{c}{4 i} \\ {0} \\ {-4} \\ {4}\end{array}\right)=\left(\begin{array}{c}12-4i\\0\\-12i\end{array}\right)$$Wir haben also zu lösen:$$\left(\begin{array}{c}16 & 0 & 0\\0 & 4 & 4\\0 & 4 & 8\end{array}\right)\cdot\vec x=\left(\begin{array}{c}12-4i\\0\\-12i\end{array}\right)$$$$\vec x=\left(\begin{array}{c}16 & 0 & 0\\0 & 4 & 4\\0 & 4 & 8\end{array}\right)^{-1}\left(\begin{array}{c}12-4i\\0\\-12i\end{array}\right)=\left(\begin{array}{c}\frac{1}{16} & 0 & 0\\0 & \frac{1}{2} & -\frac{1}{4}\\0 & -\frac{1}{4} & \frac{1}{4}\end{array}\right)\left(\begin{array}{c}12-4i\\0\\-12i\end{array}\right)$$$$\phantom{\vec x}=\left(\begin{array}{c}\frac{3}{4}-\frac{1}{4}i\\3i\\-3i\end{array}\right)$$

Avatar von 152 k 🚀

Vielen Dank für diese ausführliche Erklärung, hat mir endlich geholfen das Thema durchzublicken. Nur eine Frage außerhalb dieser Aufgabe die mir gerade beim Lesen eingefallen ist: Nur im Komplexen muss ich die adjungierte Matrix verwenden und im Reellen dann nur die transponierte Matrix oder gibt es dazu noch paar Regeln die ich beachten müsste?


Lieben Gruß

Da kann ich mich nur anschließen - ich versuche das Thema in GeoGebra zu veranschaulichen und hab einen Schritt vor Deinen Ausführungen angesetzt.

Darf ich Deinen Text mit Quellenangabe mit kleinen Abweichungen für eine GGB-App verwenden, weil besser wirds nicht :-)...

So weit bin ich gekommen:

ÜLGS.gif

Hallo wächter :)

Mit deiner Darstellung hast du dir ja eine Menge Arbeit gemacht... Ich hatte auch überlegt, ob ich das irgendwie visualisieren kann, aber dafür fehlen mir die Kenntnisse mit solchen Programmen.

Klar kannst du den Text verwenden, sehr gerne sogar...

Stefan (aka Tschakabumba)

Hallo Knax :)

Bei den reellen Zahlen ist das Skalarprodukt zwischen zwei Vektoren definiert als:$$\langle \vec x|\vec y\rangle=\vec x^T\cdot \vec y$$Streng genommen ist der erste Vektor eine \(1\times n\)-Matrix und der zweite Vektor eine \(n\times1\)-Matrix, sonst wäre die Matrix-Multiplikation nicht definiert. Wir "schlampen" das nur meistens, weil in vielen Schulbüchern das Skalarprodukt als Produkt von 2 Spaltenvektoren eingeführt wird.

Im Komplexen muss man beim Skalarprodukt den ersten Vektor transponieren und komplex konjugieren, also adjungieren:$$\langle \vec x|\vec y\rangle=\vec x^+\cdot \vec y$$

Sonst brauchst du eigentlich nichts weiter zu beachten und kannst direkt die Normalengleichung aufstellen.

Stefan (aka Tschakabumba)

Vielen Dank Stefan und super verständlich erklärt für die Klausur ^^ Schönes Wochenende!

Aloha Stefan,

ich hab ein Versucherl gemacht - wer's anschauen will...

https://www.geogebra.org/m/ytftahyv

Ich hoffe die App lädt vollständig, es gab ein paar Probleme diesbezüglich und ich hab deshalb alle CAS-Anteile entfernt.

Wenn was net passt bitte Rückmeldung, danke :-)

Aloha Wächter :)

Wow!!! Da hast du dir aber viel Mühe gegeben. Ich glaube, das kann man auch gut verstehen, wenn man den zugehörigen Text gar nicht kennt.

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community