+1 Daumen
3,4k Aufrufe

Ich wüsste zu gern, warum die Varianz als Streumaß so sehr vetreten ist.

Mich beschäftigt zum Beispiel die Frage, warum bei der Varianz quadriert wird. Warum reicht es nicht, den durchschnittlichen Abstand zum Erwartungswert zu nehmen, den gibt es ja auch so schon bereits als Streumaß.

Vermutlich wird man jetzt antworten:1) Damit Außreißer stärker gewichtet werden

                                                        2) Weil somit die Varianz immer größer oder gleich Null ist

 Zu 1): Werden Außreißer denn nicht auch so schon, ohne dass ihre Abstände zum Erwartungswert quadriert werden, automatisch stärker gewichtet einfach weil es Außreißer sind?

Zu 2): Wenn man Betragsstriche nimmt, hätte man den selben Effekt. Nun heißt es daraufhin aber immer, dass mit Beträgen zu rechnen nicht ganz so schön sei wie mit Quadraten und dass die Betragsfunktion an der Stelle 0 nicht diffbar sei. Aber dann frage ich mich, warum bei einer konkreten Versuchsreihe an sich, es eine Rolle spielt ob die Betragsfunktion diffbar ist oder nicht, wenn ich doch ohnehin mit konkreten Werten rechne. Also mir ist nicht ganz klar wo das Problem mit den Beträgen(-strichen) ist.

Avatar von

1 Antwort

0 Daumen
 
Beste Antwort

Nimm dir mal eine Gleichverteilung wie einen fairen Würfel. Nur das du nicht nur 6 Seiten nimmst sondern n Seiten. Berechne dort jetzt mal allgemein den Erwartungswert und die Varianz.

Die Varianz berechnest du jetzt einmal als den Erwartungswert der Beträge der Abweichungen und einmal als Erwartungswert der Abweichungsquadrate.

Beim Erwartungswert solltest du auf

E(X) = (n + 1)/2 kommen.

Avatar von 489 k 🚀

Erstmal lieben Dank für deine schnelle Antwort.

Beim Erwartungswert solltest du auf

E(X) = (n + 1)/2 kommen.

Diesen Teil verstehe ich nicht so ganz. Könntest du ihn mir erläutern?

Besten Dank im Voraus.

Was versteht du nicht ? mit n = 20 hast du z.B. einen 20-Seitigen Würfel, bei dem die Seiten mit den Zahlen von 1 bis 20 beschriftet sind und bei dem die Wahrscheinlichkeit für eine Seite genau bei 1/20 liegt.

Du sollst jetzt den Erwartungswert der geworfenen Augenzahl beim einfachen Wurf berechnen.

E(X) = 1·(1/n) + 2·(1/n) + 3·(1/n) + ... + n·(1/n) 

E(X) = ∑ (k = 1 bis n) (k·(1/n)) = (n + 1)/2

@Mathecoach

Was verstehst DU nicht?

Den Fragesteller beschäftigt im ursprünglichen Post, warum man als Streuungsmaß meistens die mittlere quadratische Abweichung benutzt (an Stelle anderer möglicher Streuungsmaße).

Richtig. Und ich bat ihn mal allgemein die Varianz für ein gegebenes Beispiel zu berechnen.

Er sollte erkennen das das Rechnen mit dem Abweichungsquadrat deutlich einfacher ist als mit dem Betrag unter anderem weil Summenformeln für Quadrate einfach sind und für Beträge sehr schwer.

Was soll da bitteschön einfacher sein? Bei absoluten Abweichungen lässt man einfach Minuszeichen weg und bildet von den verbleibenden nichtnegativen Zahlen das arithmetische Mittel. Wenn die Zufallsgröße irgendwelche krummen Zahlen als Abweichung hat, ist das vorherige Quadrieren deutlich aufwändiger.

Dann berechne doch mal bitte die Varianz bei einem gleich verteiltem Würfel mit n Seiten.

V(X) = ∑ (k = 1 bis n) (|k - (n + 1)/2|·(1/n))

Hier ergibt sich eine recht unschöne Formel.

Wenn man das selbe mal mit den Abweichungsquadraten macht ergibt sich folgende Formel:

∑ (k = 1 bis n) ((k - (n + 1)/2)^2·(1/n)) = (n^2 - 1)/12

Also ich muss ganz ehrlich sagen, dass ich durch eure Beiträge viel schlauer bin als vorher.

Einerseits ist es tatsächlich so, dass aufgrund algebraischer Gegebenheiten es für die mathematische Theorie und Entwicklung durchaus Sinn macht zu quadrieren statt Betragsstriche zu setzen. Das hast du sehr plausibel an diesem Beispiel gezeigt, Mathecoach. An dieser Stelle würde ich nochmal gern betonen, dass ich es Schade finde, dass in der Schulliteratur und auch in der Universitätsliteratur nie oder kaum darauf eingegangen wird, sondern es einfach vorausgesetzt wird, dass Betragsstriche zu komplizert sind, ohne auch nur einen Versuch dem Studenten oder Schüler anhand eines Beispiels klar zu machen, dass das quadrieren für weitere komplexe theoretische Aussagen ungünstig sind. Denn in deinem Beispiel, Mathecoach, habe ich diese Gegenüberstellung und sehe direkt: Aha! Ich muss bei dem Term mit den Beträgen eine Fallunterscheidung machen und bei dem quadrierten Term eben nicht!


Andererseits spielt, wie Gast62 bereits angedeutet, es in der Praxis eigentlich für Betragsstriche keine oder kaum eine Rolle, da man mit konkreten Werten arbeitet und somit bei den Betragsstrichen keine komplizierten algebraische Fallunterscheidungen vorkommen.

Mein persönliches Fazit, was das Quadrieren bei der Varianz angeht: In der mathematischen Theorie top und in der Praxis mit konkreten Werten nur zum Teil nachvollziehbar.

Besten Dank an euch beide:)

Keine Ursache. Auch mir wurde es damals wie dir beigebracht. Also die zwei Begründungen

1. Ausreißer werden nur proportional gewichtet und nicht überproportional.

2. Mit Beträgen zu rechnen ist in der Theorie nicht immer so einfach.

Du könntest z.b. von y = x^2 recht einfach das Minimum ermitteln indem Du die Ableitung gleich Null setzt.

Wenn du das mit y = |x| probierst stößt du an deine Grenzen.

Wie du bereits gesagt hast gibt es ja auch die "mittlere absolute Abweichung" in der Statistik als Steuungsmaß.

Letztendlich hat sich bei der Benutzung die Varianz und dadurch die Standardabweichung als praktikabler durchgesetzt.

Es ergeben sich z.B. in der Binomialverteilung sehr schöne Formeln wie V(X) = n * p * (1 - p)

Ich habe das jetzt nicht nachgerechnet aber ich bezweifel das das mit der mittleren absolute Abweichung auch so eine "schöne" Formel gibt.

Wer möchte darf das aber gerne mal nachrechnen.

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community