Antwort mit KI erzeugt
Wahrheitsgehalt von statistischen Aussagen
Um die Größe einer Stichprobe zu bestimmen, die erforderlich ist, um mit einer bestimmten Wahrscheinlichkeit eine Aussage über eine Population zu treffen, verwenden StatistikerInnen häufig die Formel für den erforderlichen Stichprobenumfang bei gegebener Breite des Konfidenzintervalls und Varianz in der Population. Diese Frage berührt auch das Konzept der statistischen Power und die zentrale Grenzwerttheorie, welche besagt, dass die Verteilung von Stichprobenmittelwerten einer Normalverteilung zuneigt, wenn die Stichprobengröße groß genug ist – üblicherweise wird eine Größe von über 30 als ausreichend angesehen.
Die allgemeine Formel zur Bestimmung der Größe einer Stichprobe (\(n\)) mit einer gewünschten Genauigkeit (Breite des Konfidenzintervalls) und einem bestimmten Konfidenzniveau (\(z\)) lautet wie folgt:
\(
n = \left( \frac{z \times \sigma}{E} \right)^2
\)
wo:
- \(z\) der z-Wert ist, der dem gewünschten Konfidenzniveau entspricht (für 99,5 % Konfidenzniveau ist der z-Wert 2,576),
- \(\sigma\) die Standardabweichung in der Population ist (wenn unbekannt, kann sie durch eine vorläufige Studie geschätzt werden oder man benutzt einen angenommenen Wert basierend auf früheren Studien),
- \(E\) der gewünschte Fehlerspielraum ist, auch bekannt als der halbe Breite des Konfidenzintervalls.
Ohne spezifische Informationen über die Variation in der Population (Standardabweichung) oder den gewünschten Fehlerspielraum können wir nicht direkt eine spezifische Stichprobengröße berechnen.
Jedoch gibt es für Meinungsumfragen oder ähnliche Studien eine vereinfachte Formel zur Schätzung der erforderlichen Stichprobengröße für eine unendlich große Population, die wie folgt lautet:
\(
n = \frac{z^2 \times p(1-p)}{E^2}
\)
wobei:
- \(p\) die geschätzte Verteilung des interessierenden Merkmals in der Population ist (z.B. 0,5 für 50 %, was die maximale Varianz ergibt und folglich eine konservative Schätzung der nötigen Stichprobengröße liefert),
- \(E\) die Breite des Konfidenzintervalls relativ zum Anteil ist, ausgedrückt als Anteil (z.B. für einen Fehlerspielraum von \(\pm\)5 %, \(E = 0,05\)).
Nehmen wir zum Beispiel an, wir möchten mit einer 99,5 % Wahrscheinlichkeit eine Aussage treffen und akzeptieren einen Fehler von 5 % (\(E = 0,05\)). Setzen wir p = 0,5 für die maximale Varianz, erhalten wir:
\(
n = \frac{2,576^2 \times 0,5 \times (1-0,5)}{0,05^2} = \frac{6,635 \times 0,25}{0,0025} = \frac{1,65875}{0,0025} = 663,5
\)
Dies bedeutet, dass eine Stichprobengröße von mindestens 664 Personen erforderlich wäre, um mit 99,5% Wahrscheinlichkeit eine Aussage über eine Population zu treffen, mit einem Fehlerbereich von \(\pm\)5%.
Die Benutzung von Stichproben mit 100 bis 300 Personen in psychologischen, medizinischen oder soziologischen Studien beruht auf der Annahme, dass solche Größen ausreichen, um die erforderlichen Informationen über die Population zu erhalten, unter der Voraussetzung, dass die Stichprobe gut gewählt ist und die Varianz in der Zielbevölkerung nicht extrem hoch ist. Es ist wesentlich anzumerken, dass jede Stichprobengröße einen Kompromiss zwischen Kosten, Zeitaufwand und der Genauigkeit der Ergebnisse darstellt. Im Kontext von Forschungsstudien ist ein 95%-iges Konfidenzniveau üblich, aber für Entscheidungen mit weitreichenden Folgen wird möglicherweise ein höheres Konfidenzniveau wie 99,5% bevorzugt.