0 Daumen
952 Aufrufe
Hallo,
ich geb gleich zu, die Frage kommt eigentlich eher aus dem Informatik-Bereich, da jedoch dort ohnehin beinahe alles auf Mathematik beruht, möchte ich mal hier mein Glück versuchen:

Die Aufgabe:
Wir betrachten das Perzeptron in $$ \mathbb{R}^2$$ mit einem Gewichtsvektor $$W = (w_0, w_1, w_2)^T = (3,1,1)^T$$
Zeichnen Sie die trennende Hyperebene in einem kartesischen Koordinatensystem und markieren Sie den Bereich, für den die Klassifizierung -1 ist.


An dieser Stelle würde ich nun gerne einen Ansatz präsentieren, aber habe leider keinen..
Ich weiß zwar bruchstückmäßig, dass ein Perzeptron ein überwachter Lernalgorithmus ist, dessen Aufgabe es beim Klassifizieren ist, eine Hyperebene (oder Gerade im einfachen Falle) zwischen 2 Klassen zu ziehen, aber das wars dann leider auch schon.

Würde mich daher freuen, wenn mir jemand einen Tipp geben könnte!
Avatar von
Wir betrachten das Perzeptron in \( \mathbb{R}^2\)

Müsste das nicht \(\mathbb{R}^3\) sein, wegen der drei Gewichte?

den Bereich, für den die Klassifizierung -1 ist.

Ich dachte die Klassifizierung wäre entweder 1 oder 0, und zwar

        \(f(\vec{x}) = \begin{cases}1&\text{falls }\vec{x}\cdot \begin{pmatrix}3\\1\\1\end{pmatrix} > 0\\0&\text{sonst}\end{cases}\)

Danke für deine Antwort!


Genau die Fragen hab ich mir (unter anderem) gestern auch gestellt...

Evtl. ist eine der Zahlen der BIAS?

Ich habe mir gestern nochmal die Funktionsweise eines Perzeptrons angesehen:

Ich habe also die 3 (oder 2?) Eingänge in das Perzeptron. Die werden da multipliziert und aufsummiert... Nehm ich mir nun einfach ein paar beliebige x-Werte und schau was dafür rauskommt?

1 Antwort

0 Daumen

Hallo,

Müsste das nicht \(\mathbb{R}^3\) sein, wegen der drei Gewichte?
Evtl. ist eine der Zahlen der BIAS?

in der Aufgabe steht

... markieren Sie den Bereich, für den die Klassifizierung -1 ist.

womit ich zunächst auch nichts anfangen könnte. Aber es könnte doch sein, dass mit 'Klassifizierung -1' die Ebene$$E:\quad \begin{pmatrix}x_1\\ x_2\\ -1\end{pmatrix}$$gemeint ist. Wenn dem so ist, dann könnte es doch heißen$$f(\vec{x}) = \begin{cases}1&\text{falls }\begin{pmatrix}x_1\\ x_2\\ -1\end{pmatrix}^T\cdot \begin{pmatrix}3\\1\\1\end{pmatrix} > 0 \to 3x_1+x_2-1>0\\0&\text{sonst}\end{cases}$$

Zeichnen Sie die trennende Hyperebene in einem kartesischen Koordinatensystem und markieren Sie den Bereich, für den die Klassifizierung -1 ist.

und das sähe dann wohl so aus:

im roten Bereich feuert das Perzeptron. Die Gerade \(3x_1+x_2-1=0\) selbst gehört noch nicht dazu (daher die gestrichelte Darstellung).

Gruß Werner

Avatar von 48 k

Danke für deine Antwort!

Hmm..So ganz steig ich da aber leider noch nicht dahinter.

Also ist jetzt ein Input-Wert "fixiert" auf -1 ?

Den gebe ich jetzt zusammen mit den anderen 2 in das Perzeptron. Dort werden diese mit den Gewichten multipliziert und anschließend aufsummiert. Wenn das Ergebnis nun den Grenzwert von 0 überschreitet, 'feuert' das Perzeptron, sonst nicht.

Hab ich das so richtig verstanden?

So ganz steig ich da aber leider noch nicht dahinter.

Du hast 2 Inputwerte und einen Bereich für den die "Klassifizierung -1" ist. Was immer das genau bedeuten soll! Sicher bin ich mir natürlich nicht, ob Dein Prof/Dozent das auch so sieht!

Aber grundsätzlich könnte man sich das so vorstellen, dass diese 'Klassifitierung' eine zusätzliche Dimension aufzieht. D.h. man stelle sich das ganze 3-dimensional vor. Das könnte so aussehen:

blob.png

(klick auf das Bild und rotiere die Szene mit der Maus, sonst kannst Du es Dir womöglich nicht vorstellen)

Der Vektor \((3,1,1)^T\) beschreibt die (im Bild grüne) Hyperebene. Die 'Musik' - z.B. die Inputwerte im \(\mathbb R^2\) - spielt aber nur in der Ebene \(x_3=-1\). Die habe ich im Bild grau und lila markiert. Ein Inputvektor hat stets eine dritten Wert \(x_3=-1\). Ob das Perzeptron dann feuert hängt dann nur davon ab, ob dieser Vektor sich oberhalb (roter Vektor) oder unterhalb (blauer Vektor) der Hyperebene befindet.

Und wo 'oben' und 'unten' ist, wird lediglich durch den Vektor \((3,1,1)^T\) definiert.

Diese dritte Dimension bezeichnet man auch als homogene Koordinate. Das ganze dient lediglich dazu, aus einer affinen Abbildung eine lineare Abbildung zu machen, die dann mathematisch einfacher zu behandeln ist.

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community