0 Daumen
476 Aufrufe

Aufgabe:

Gegeben sei eine Messwertreihe für das Merkmal Y.

Und gesucht sei die Standardabweichung.

Meine riesen Frage ist, woher weiß ich ob die Standardabweichungsformel für Stichprobe (n-1) oder für die Grundgesamtheit(n) verwenden muss?


Das ist mir aus der Aufgabe nicht schlüssig.

Avatar von

2 Antworten

0 Daumen
 
Beste Antwort

Aloha :)

Betrachte eine Zufallsgröße \(X\) mit \(N\) möglichen Ausgängen \(x_k\), die jeweils mit der Wahrscheinlichkeit \(p_k\) eintreten. Dann ist die Varianz dieser Zufallsgröße:$$V(X)=\sum\limits_{k=1}^Np_k\cdot(x_k-\mu)^2\quad;\quad\mu\coloneqq\sum\limits_{k=1}^Np_kx_k$$

Darin ist \(\mu\) der exakte Erwartungswert.

Im Regelfall ist es jedoch so, dass man die \(N\) möglichen Ausgänge \(x_k\) oder deren Eintrittswahrscheinlickeiten \(p_k\) gar nicht alle genau kennt. In diesen Fällen nimmt man sich dann eine Stichprobe mit \(n\) Elementen (das kleine "n" ist die Größe der Stichprobe, im Unterschied zum großen "N", das die Anzahl aller möglichen Ausgänge des Zufallsexperimentes beschreibt.). Jedes dieser \(n\) Elemente wird mit derselben Eintrittswahrscheinlichkeit \(p_k=\frac1n\) gewichtet und an die Stelle des exakten Erwartungswertes \(\mu\) tritt der Mittelwert \(\overline x\) der Stichprobe:$$\blue{V(X)=\frac1n\sum\limits_{k=1}^n(x_k-\overline x)^2\quad;\quad\overline x=\frac1n\sum\limits_{k=1}^nx_k}$$

Diese Formel ist jedoch nicht ganz richtig (deswegen habe ich sie in blau dargestellt). Hintergrund ist, dass der Mittelwert \(\overline x\) gegenüber dem (unbekannten) exakten Erwartungswert \(\mu\) eine Abweichung enthält. Diese Abweichung wird umso kleiner, je mehr Elemente wir in der Stichprobe haben, also je größer \(n\) ist. Diese Abweichung pflanzt sich in die Berechnung der Varianz fort und wird in der blauen Formel nicht berücksichtigt. Die blaue Formel unterschätzt daher die tatsächliche Varianz der Stichprobe.

In einer etwas längeren Rechnung kann man aber zeigen, dass sich dieses Unterschätzen dadurch "heilen" lässt, dass man in der Varianz den Vorfaktor \(\frac1n\) durch den Vorfaktor \(\frac{1}{n-1}\) ersetzt:$$V(X)=\frac{1}{n-1}\sum\limits_{k=1}^n(x_k-\overline x)^2\quad;\quad\overline x=\frac1n\sum\limits_{k=1}^nx_k$$

Avatar von 152 k 🚀

Oder kurz: die sogenannte korrigierte Stichprobenvarianz mit dem Faktor \(\frac{1}{n-1}\) ist ein erwartungstreuer Schätzer für die Varianz. Die "normale" Stichprobenvarianz ist das nicht.

vielen Dank. Aber leider hat niemand meine Frage beantwortet.

Ich kann anhand der Aufgabenstellung nicht herausfinden ob des von der Grundgestheit ist oder nicht.

Dann poste mal die Aufgabenstellung vollständig im Original.

Eine Messwertreihe ist nie von der Grundgesamtheit. Es ist ja nur eine Stichprobe. Und wenn von der Grundgesamtheit nichts bekannt ist, dann hast du hier nur die Möglichkeit über die Stichprobenvarianz zu gehen. Das wurde dir aber in der Antwort von oswald schon gesagt.

Das habe ich doch geschrieben. Kennst du alle möglichen Messergebnisse und die Wahrscheinlichkeit für deren eintreten? Nein! Also hast du es mit einer Stichprobe zu tun ;)

Aber der Mittelwert erhält nie ein 1/(n-1)?

Richtig, der Mittelwert wird immer durch die Anzahl \(n\) der Elemente in der Stichprobe geteilt. Die Varianz wird hingegen durch \((n-1)\) geteilt, da der Mittelwert \(\overline x\) nur eine Näherung für den tatsächlichen Erwartungswert \(\mu\) ist und eine Abweichung enthält, die in der Varianz durch das \((n-1)\) an Stelle von \(n\) berücksichtigt wird.

Du bist der beste Tschakabumba! Danke dir!

0 Daumen

Wenn der Mittelwert der Grundgesamtheit bekannt ist, dann verwende ihn und teile durch \(n\).

Wenn der Mittelwert der Grundgesamtheit nicht bekannt ist, dann schätze ihn mittels des Mittelwertes der Stichprobe und teile durch \(n-1\).

Avatar von 107 k 🚀

Also ich habe die Messwertreihe.

Und daraus kann ich natürlich den Mittelwert bestimmen? oder was meinst du genau?

Der Mittelwert ist doch errechenbar!

Es geht um den Mittelwert der Grundgesamtheit, nicht den Mittelwert der Messreihe.

Ich frage jede Person in meinem Haushalt nach ihrem Alter:

        8, 9, 11, 28, 29.

Das Durschnittsalter ist 17.

Wenn ich die Standarabweichung des Alters der Person in meinem Haushalt berechnen möchte, dann teile ich durch 5, weil ich das Durschnittsalter der Personen in meinem Haushalt kenne.

Wenn ich die Standarabweichung des Alters der Person in Deutschland berechnen möchte, dann teile ich durch 4, weil ich das Durschnittsalter der Personen in Deutschland nicht kenne, sondern nur mittels des Durschnittsalters der Personen in meinem Haushalt geschätzt habe.

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community