0 Daumen
1,6k Aufrufe

Hallo liebe Leute, ich hänge bei einer Aufgabe zu mehrdimensionalen Funktionen. Gegeben ist die Funktion f(x_(1),...,x_(n))=||Ax-b||_(2)*||Ax-b||_(2). Wobei A eine mxn Matrix ist x ein nx1 Vektor und b ein mx1 Vektor. Ich will den Gradient von f und die Hessematrix berechnen. Das heißt ich hab einfach eingesetzt mit meinen beliebigen Vektor und Matrizen und dann schaut meine Funktion ca. so aus: f(x)= y1^2+y2^2...+ym^2. Wobei meine ym = Summe(k=1,n, a_(jk)*x_(k)-bj) sind mit j aus 1,...,m. So jetzt hätte ich einfach nach x1 usw abgeleitet, indem zuerst Potenzregel (^2) und dann innerhalb der ym. Darf ich das???

2.Frage: Ich soll dann auch die Normalenungleichung für ein lokales Minimum beweisen. Da muss ich dann die Ableitung null setzen oder? Ich hab schon auf Wikipedia nachgesehen, ich müsste auf einen Ausdruck: 2*(Ax-b)^T * A = 0 kommen, nur wie das (Ax-b)^T in der Mitte entsteht seh ich einfach nicht...

Kann mir jemand helfen bitte?

LG Mathstiger

Avatar von
f(x1,..., xn)=||Ax-b||_(2)*||Ax-b||_(2). Wobei A eine mxn Matrix ist x ein nx1 Vektor und b ein mx1 Vektor.

Und wo in deinem Funktionsterm kommen die x1 bis xn vor, von denen der Funktionswert abhängt?

Fall die nicht vorkommen, dann handelt es sich um eine konstante Funktion mit Ableitung 0.

2 Antworten

0 Daumen

Du kannst das auf zwei Arten rechnen.

• Schreibe \(f(x_1,\ldots,x_n)=\lVert Ax-b\rVert^2\) bis runter zu den Komponenten komplett aus.

• \(f(x)=g(h(x))\) mit \(h(x)=Ax-b\) und \(g(x)=\lVert x\rVert^2\). Benutze die Kettenregel.

Avatar von
0 Daumen

  Ich find sie geil, weil die Antwort nicht trivial ist. Wir bedienen uns mit Vorteil der ===>  Einsteinschen Indexkonvention .


    f  =  (  A_ik  x_k  -  b_i  )  (  A_im  x_m  -  b_i  )       (  1  )


     Jetzt der Gradient; Produktregel. Ableiten nac h x_r


   f_r  =  A_ik DELTA ( k ; r ) ( A_im x_m - b_i ) + ( A_ik x_k - b_i ) A_im DELTA ( m ; r ) =  (  2a  )


      =  (  A_ir  A_im  )  x_m  -  A_ir  b_i  +  (  A_ir  A_ik  )  x_k  -  A_ir  b_i  =   (  2b  )

    =  2  [  (  A_ir  A_im  )  x_m  -  A_ir  b_i  ]     (  2c  )


    Was haben wir hier eigentlich?  Die Normale Matmul geht doch


          C  :=  A  B       (  3a  )

        C_im  =  A_ik  B_km       (  3b  )


     und nicht etwa


     C_im  =  A_ik  B_im     (  3c  )


   Was du in  ( 2c ) hast, ist viel mehr eine Hermitesche Konjugation.


       A_ir  A_im  =  (A+)_ri  A_im  =:  H_rm      (  4  )


     mit H :=  (A+)  A  , was in jedem Falle Hermitesch ist. Somit


    grad  (  f  )  =  2  [  H  x  -  (A+)  b  ]       (  5a  )


   Du siehst das ganz gut ein, wenn du mal den eindimensionalen Fall betrachtest:


        f  (  x  )  =  (  a  x  -  b  )  ²      (  5b  )

    f  '  (  x  )  =  2  a  (  a  x  -  b  )  =  2  (  a  ²  x  -  a  b  )      (  5c  )


   Bereits hier hast du den Faktor 2 ;  a ² entspricht hier dem Hermiteschen Operator  H und a im zweiten Term dem (A+)  Es nutzt nichts; selbst wenn du b = 0 setzt, lautet das Prinzip hinter der Fünktion y = a ²  x  ²   und nicht etwa  a  x  ²

   Und aus ( 5a ) folgt eben als Hessematrix 2 H genau wie im eindimensionalen Fall y " = 2 a ²  , wo a ² die Rolle der Hessematrix übernimmt.

Avatar von 5,5 k

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community