0 Daumen
729 Aufrufe

Hey, stimmt diese Ableitung so? Für \( f(x)=\frac{1}{2}x^TAx-x^Tb\) habe ich  \( f'(x)=\frac{1}{2}(A^T+A)x-b\) und wenn A symmetrisch ist, dass ist  \( f'(x)=Ax-b\)?


Könntet ihr mit vielleicht sagen, wie genau man auf $(A^T+A)x$ kommt?

VG

Avatar von

Hallo

f' wird i,A, für Ableitung nach einer reellen Variablen benutzt, was bedeutet f'(\( \begin{pmatrix} x\\y\\z \end{pmatrix} \)) z.B.

lul

Für eine vektorwertige Funktion \(f\) definiert man \(f'(x)=Df(x)=\left(\frac{\partial f_i(x)}{\partial x_j}\right)_{ij}\)

Darf ich fragen, was man sich unter der Ableitung einer Matrix bildlich vorstellen kann?

Ableitung einer Matrix

Es handelt sich um die Ableitung einer Funktion f : ℝ^n → ℝ^m (hier ist m=1), also bestenfalls um die Ableitungen von m Matrizen der Form n×1, und das sind die jeweiligen Anstiege in Richtung der n Koordinatenachsen.

Hey, vielen Dank für eure Antworten. A solle eine symmetrisch positiv Defizite Matrix sein und die x sind vektorwertig, aber mehr weiß ich leider auch nicht:(

1 Antwort

0 Daumen
 
Beste Antwort

Verwende die Definition der Matrixvektormultiplikation. Es ist \(x^TAx=\sum_{i,j} x_ia_{ij}x_j\). Jetzt bilde entsprechend die Einträge von \(Df(x)=\left(\frac{\partial f_i(x)}{\partial x_j}\right)_{ij}\) (bekannt als Jacobi-Matrix).

Alternativ über die Produktregel:

\( \mathbf{x^T}\dfrac{\partial \mathbf{Ax}}{\partial\mathbf{x}}+(\mathbf{Ax})^T\dfrac{\partial \mathbf{x}}{\partial\mathbf{x}}\)

\(=\mathbf{x^TA}+\mathbf{x^TA^TI}\)

\(=\mathbf{x^TA}+\mathbf{x^TA^T}\)

\(=\mathbf{x^T}(\mathbf{A+A^T})\)

Den Faktor \(\frac{1}{2}\) habe ich der Einfachheit halber weggelassen. Ist \(A\) symmetrisch, so gilt \(A=A^T\) und das Ganze wird zu \(2Ax\).

Avatar von 19 k

Vielen lieben Dank:)

Ich habe doch noch eine kurze Frage: Müsste es mit der Produktregel am ende nicht doch 2Ax^T sein? Könntest du vielleicht bitte sagen wieso das w^T zu w wird?

Letztendlich kommt es darauf an, ob man die Jacobi-Matrix betrachtet oder den Gradienten (weil hier m=1). Die Jacobi-Matrix wäre dann ein Zeilenvektor, während der Gradient ein Spaltenvektor ist. Du kannst aber den Vektor einfach transponieren, um das Gewünschte zu erhalten. Mit \(f'(x)\) scheint in deinem Fall eher der Gradient gemeint zu sein. Also musst du das Ergebnis entsprechend transponieren.

Vielen dank, dass macht Sinn:)

Könnte man es ansonsten auch so begründen, dass  x^TA = Ax?

Nein. Es ist \(x^TA^T=(Ax)^T \). Daher ja auch der Wechsel vom Spalten- zum Zeilenvektor.

Ahh jetzt verstehe ich, vielen Dank:)

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community