Hallo zusammen, da ich mit dem Thema Statistik bisher nicht viel zu tun hatte, aber eine kleine Umfrage durchführe, benötige ich Hilfe von Leuten, die sich damit einfach viel besser auskennen als ich.
Mein Problem ist wie folgt (Zahlen leicht abgeändert):
Eine überschaubare Grundgesamtheit (422) wurde befragt. Die Teilnahme erfolgte per Selbstselektion, alle wurden eingeladen, einige (111) nahmen daraufhin teil. Von diesen 111 Teilnehmern machten 78,08% Angaben zu ihrem Merkmal X durch Auswahl von a, b oder c, siehe Spalte 2. In der Grundgesamtheit liegt Merkmal X wie in Spalte 3 vor.
Merkmal X
| Anteil Stichprobe
| Anteil Grundgesamtheit
| a
| 40 (36,0%)
| 266 (63,0%)
| b
| 35 (31,5%)
| 110 (26,1%)
| c
| 8 (7,2%)
| 42 (10,0%)
| Gesamt
| 83 (74,8%)
| 422 (99,1%) | Enthaltungen: 28 | 4 ohne Merkmal
|
Ich habe einen Qui-Quadrat-Test durchgeführt, mit dem Ergebnis, dass sich die Stichprobe signifikant von der Verteilung der Merkmale in der Grundgesamtheit unterscheidet. Wenn ich richtig gerechnet habe, bräuchte ich für a 12 weitere Befragte, für b müsste ich zufällig 13 entfernen und c könnte so bleiben, dann wäre es repräsentativ.
Hinzufügen kann ich nicht, weil die Grundgesamtheit bereits mehrfach eingeladen wurde. Wenn ich nur bei b Einträge entferne, bei a aber keine hinzufüge, bleibt es nicht repräsentativ oder? Außerdem wäre meine Grundgesamtheit dann ja deutlich kleiner.
Falls ich richtig gerechnet habe, wie aussagekräftig ist das, wenn es sich um ein eher unwichtiges Merkmal handelt? Gibt es hier vielleicht einen Statistiker, der Einblick in Umfrageinstitute hatte und weiß, wie die das machen? Was, wenn zwei andere Merkmale die Grundgesamtheit super repräsentieren, dieses eine aber nicht?
Ich bin da leider total überfordert und wäre sehr dankbar, wenn mir jemand ein paar Tipps geben könnte.