0 Daumen
294 Aufrufe


Bravias-Pearson-Korrelationskoeffizient


-> Woher kommt das n ... müsste es nicht 1/n vor dem Summenzeichen jeweils sein?

Text erkannt:

\( r_{x y}=\frac{\sigma_{x y}}{\sigma_{x} \sigma_{y}}=\frac{\sum x_{i} y_{i}-n \bar{x} \bar{y}}{\sqrt{\sum x_{i}^{2}-n(\bar{x})^{2}} \cdot \sqrt{\sum y_{i}^{2}-n(\bar{y})^{2}}} \)

Avatar von

Ich sehe hier kein n-Stern nur ein normales n.

* = Malzeichen

Deine Formel scheint mir irgendwie verstümmelt zu sein.

Wenn Du aufschreiben oder zur Not abfotographieren könntest, welche Formel Du erwartest und welche Du hast, dann kann jemand Dir zeigen, ob und wie man die beiden Formeln ineinander überführen kann, und auch bestätigen ob sie richtig sind, um den Korrelationskoeffizienten auszurechnen.

Ich hätte erwartet, dass Matheexperten die Formel zur Pearson Korrelation kennen...

\( r_{x, y}=\frac{\frac{1}{n} \sum \limits_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sqrt{\frac{1}{n} \sum \limits_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}} \cdot \sqrt{\frac{1}{n} \sum \limits_{i=1}^{n}\left(y_{i}-\bar{y}\right)^{2}}} \).

Es gibt eben mehrere Formeln für denselben Koeffizienten, deshalb.

3 Antworten

+3 Daumen
 
Beste Antwort

Aloha :)

Wenn jemand eine Formel auswendig lernen muss, hat er sie nicht verstanden.

Gegeben sind zwei gleich große Messreihen \((x_1;\ldots;x_n)\) und \((y_1;\ldots;y_n)\). Um die Schwankungen der beiden Messreihen vergleichen zu können, subtrahieren wir von jedem Messwert einer Messreihe den jeweiligen Mittelwert der Messreihe und tragen die Ergebnisse in Vektoren ein:$$\vec x\coloneqq\begin{pmatrix}x_1-\overline x\\\vdots\\x_n-\overline x\end{pmatrix}\quad;\quad\vec y\coloneqq\begin{pmatrix}y_1-\overline y\\\vdots\\y_n-\overline y\end{pmatrix}$$Die Komponenten beschreiben jetzt die Schwankungen um die Null herum.

Der Korrerlationskoeffizient ist der Cosinus des Winkels zwischen diesen beiden Vektoren:$$\cos\angle(\vec x;\vec y)=\frac{\vec x\cdot\vec y}{\|\vec x\|\cdot\|\vec y\|}=\frac{\sum\limits_{i=1}^n(x_i-\overline x)\cdot(y_i-\overline y)}{\sqrt{\sum\limits_{i=1}^n(x_i-\overline x)^2}\cdot\sqrt{\sum\limits_{i=1}^n(y_i-\overline y)^2}}$$

Damit ist sofort klar, dass der Korrelationskoeffizient im Intervall \([-1;1]\) liegt.

Deine Formel verschleiert diesen einfachen Zusammenhang nahezu perfekt. Sie ist aber dennoch richtig. Den Zähler kannst du direkt umformen:$$Z=\sum\limits_{i=1}^n(x_i-\overline x)\cdot(y_i-\overline y)=\sum\limits_{i=1}^n(x_iy_i-\overline xy_i-x_i\overline y+\overline x\,\overline y)$$$$\phantom Z=\sum\limits_{i=1}^nx_iy_i-\overline x\cdot\underbrace{\sum\limits_{i=1}^ny_i}_{=n\overline y}-\overline y\cdot\underbrace{\sum\limits_{i=1}^nx_i}_{=n\overline x}+\underbrace{\sum\limits_{i=1}^n \overline x\,\overline y}_{=n\,\overline x\,\overline y}=\sum\limits_{i=1}^nx_iy_i-n\,\overline x\,\overline y$$

Die Umformung des Nenners ist nun geschenkt, denn du brauchst ja in der vorigen Rechnung nur \(y\) durch \(x\) oder umgekehrt zu ersetzen:$$N=\sqrt{\sum\limits_{i=1}^n(x_i-\overline x)^2}\cdot\sqrt{\sum\limits_{i=1}^n(y_i-\overline y)^2}=\sqrt{\sum\limits_{i=1}^nx_i^2-n\,\overline x^2}\cdot\sqrt{\sum\limits_{i=1}^ny_i^2-n\,\overline y^2}$$

Ich würde mir niemals irgendeine Formel zu Korrelationskoeffizienten merken, sondern habe das Bild mit den beiden Vektoren im Kopf, deren Ähnlichkeit darüber gemessen wird, die groß der Winkel zwischen ihnen ist.

Avatar von 152 k 🚀
+1 Daumen

Was denkst du wieviele Formeln aus wievielen Gebieten "Matheexperten" auswendig können? wie oft denkst muss ein Matheexperte den Bravias-Pearson-Korrelationskoeffizienten bestimmen.
Sieh in wiki nach da steht die vereinfachte Formel ohne 1/n direkt nach der mit 1/n einfach ein bissel ausmultipluieren und mit n erweitern.
lul

Avatar von 108 k 🚀
0 Daumen

Ausgehend von deiner Formel, lässt sich der Faktor \(\frac{1}{n}\) zunächst kürzen, so dass man

\( r_{x, y}=\frac{\sum \limits_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sqrt{\sum \limits_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}} \cdot \sqrt{\sum \limits_{i=1}^{n}\left(y_{i}-\bar{y}\right)^{2}}} \) erhält.

Der Rest ergibt sich aus dem Verschiebungssatz für die Summe der Abweichungsquadrate bzw. der Abweichungsprodukte.

https://de.wikipedia.org/wiki/Verschiebungssatz_(Statistik)#Anwendungen

Avatar von 19 k

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community