0 Daumen
364 Aufrufe

Hey,
währe super nett, wenn hier mal jemand drüber schauen könnte, ich bin mir nicht sicher, ob es sich bei der Aufgabe um einen 1 oder zweiseitigen Hypothesentest handelt.Statistik 2 Kopie.jpeg

Text erkannt:

Aufgabe 7 (12 Punkte) Statistik
1) Jana nimmt an einer Umfrage teil, wie viel Prozent der eingehenden Mails Spam
sind in die folgende Tabelle eingetragen.
\begin{tabular}{|l|l|l|l|l|l|l|l|l|}
\hline Name & Jana & Ahmet & Simon & Maja & Yasmin & Peter & Thomas & Lisa \\
\hline Anzahl & 5 & 20 & 4 & 80 & 7 & 10 & 12 & 4 \\
\hline
\end{tabular}
Bestimmen Sie Modus, Median, arithmetisches Mittel und Stichprobenvarianz zu diesen
Daten. Erläutern Sie mit eigenen Worten, warum Median und arithmetisches Mittel sich so
Dem Ersteller der Umfrage erscheint Majas Angabe, dass \( 80 \% \) der bei ihr
eingehenden Mails, Spam sind zu hoch. Daher bittet er sie 5 Monate lang die Anzah
der Spam-Mails zu notieren. Von 4000 Empfangen Mails, sind 3000 Spam. Reicht
abzulehnen?
2)
\( \begin{array}{l} n=4000 \quad \varphi=0,8 \\ E\left(S_{4000}\right)=\mu=4000 \cdot 0,8=3200 \\ \operatorname{Var}(x)=0^{2}=n \cdot p \cdot(1-p)=3200 \cdot(1-0,8)=640 \\ x_{i} \sim B(n=4000, p=0,8) \\ \end{array} \)
\( \begin{aligned} P\left(S_{4000} \geq z\right) & =P\left(\frac{S_{4000}-3200}{\sqrt{640}} \geq \frac{z-3200}{\sqrt{640}}\right) \\ & =1-Q\left(\frac{S 4000-3000}{\sqrt{640}}<\frac{z-3200}{\sqrt{640}}\right) \\ & =1-\Phi\left(\frac{z-3200}{\sqrt{640}}\right) \end{aligned} \)

Konfidenzniveav: \( 95 \% \)
\( 1 \text { - } 0\left(\frac{z-3200}{\sqrt{640}}\right)<0,5 \)
\( \Leftrightarrow\left(\frac{z-3000}{\sqrt{640}}\right)>0.95 \)
\( \Leftrightarrow \frac{z-3200}{\sqrt{640}}>1.65 \)
\( \Leftrightarrow z>3241,79 \)
\( A \text { So }(Z \in \mathbb{N}) Z \geq 3242 \)

Ho ablehnen, wern 3242 Spam Mails eintreffen Ammahmebereich \( [0,3241] \quad \) Ablehnungsereich [3242, 4000\( ] \)

Avatar von

Mach dir klar, dass du bei 80% Spammails, also bei 3200 von 4000 Majas Hypothese nicht ablehnen würdest. Frage dich, wann du die Hypothese ablehnen würdest.

2 Antworten

0 Daumen

Dass der Test nicht zweiseitig sein kann, erkennt man an der Aufgabe schon daran, dass eine Tendenz vorgegeben wird, da man die Angabe für zu hoch hält (und nicht einfach nur für falsch).

Es ist hier allerdings kein rechtsseitiger, sondern ein linksseitiger Test. Deine Entscheidungsregel ist demnach falsch. Man lehnt die Nullhypothese ja ab, wenn signifikant wenige Spam-Mails kommen. Der Verwerfungsbereich liegt also links.

Avatar von 18 k

Okay, das habe ich verstanden.

Dazu ein paar Fragen:

1 : Also ist der Ablehnungsbereich zwischen 0 - 3241 und der Annahmebereich zwischen 3242 - 4000 ?


2: Ist denn ansonsten alles richtig ? Auch von der Notation ?

3: Was ich dabei noch nicht ganz verstehe, ist folgendes: Im Ablehnungsbereich sind ja Werte dabei, bei denen ja doch 80 % oder mehr Spam sind. Wenn ich mir einfach mal die Größte Zahl im Ablehnungsbereich nehme ( 3241 ) und diese durch n Teile, dann komme ich auf 81.03 %. Wie kann das sein ?


Hier noch einmal die Korrigierte Form, hoffe das passt so.Statistik 2 Kopie 2.jpeg

Text erkannt:

Aufgabe 7 (12 Punkte) Statistik
1) Jana nimmt an einer Umfrage teil, wie viel Prozent der eingehenden Mails SpamMails sind. Im Rahmen dieser Umfrage werden 8 Personen befragt. Die Ergebnisse sind in die folgende Tabelle eingetragen.
\begin{tabular}{|l|l|l|l|l|l|l|l|l|}
\hline Name & Jana & Ahmet & Simon & Maja & Yasmin & Peter & Thomas & Lisa \\
\hline Anzahl & 5 & 20 & 4 & 80 & 7 & 10 & 12 & 4 \\
\hline
\end{tabular}
Bestimmen Sie Modus, Median, arithmetisches Mittel und Stichprobenvarianz zu diesen
Daten. Erläutern Sie
2) Dem Ersteller der Umfrage erscheint Majas Angabe, dass \( 80 \% \) der bei ihr
eingehenden Mails, Spam sind zu hoch. Daher bittet er sie 5 Monate lang die Anzahl
dieses Ergebnis aus, um Majas Angabe (bei einem Konfidenzniveau von \( 95 \% \) )
abzulehnen?
2)
H1: \( 9<0,8 \)
\( n=4000 \quad \varphi=0,8 \)
\( \begin{aligned} E\left(S_{4000}\right)=\mu & =4000 \cdot 0,8=3200 \\ \operatorname{Var}(x)=0^{2} & =n \cdot p \cdot(1-q)=3200 \cdot(1-0,8)=640 \\ X_{i} \sim B(n & =4000, p \cdot 0,8) \\ P\left(S_{4000} \geq z\right) & =P\left(\frac{S_{4000}-3200}{\sqrt{640}} \geq \frac{z-3200}{\sqrt{640}}\right) \\ & =1-Q\left(\frac{54000 \cdot 3000}{\sqrt{640}}\left(\frac{z-3200}{\sqrt{640}}\right)\right. \\ & =1-Q\left(\frac{z-3300}{\sqrt{640}}\right) \end{aligned} \)

Konfidenzniveav: \( 95 \% \)
\( 1 \text { - }\left(\frac{z-300}{\sqrt{640}}\right)<0,5 \)
\( \Leftrightarrow\left(\frac{z-3000}{\sqrt{640}}\right)>0.95 \)
\( \Leftrightarrow \frac{2-3200}{\sqrt{640}}>1.65 \)
\( \Leftrightarrow z>3241,79 \)
\( A \text { So }(Z \in \mathbb{N}) Z \geq 3242 \)

Ho ablehnen, wenn 3241 oder oeniger Spam Mails eintreffen
tblehungsbereich \( [0,3241] \)
Anmahmebereich [ 3242,4000\( ] \)

1. Ja, das passt so.

2. Notation ist auch in Ordnung. Macht ihr bei der Approximation mit der Normalverteilung keine Stetigkeitskorrektur? Rechne ich mit der Binomialverteilung, komme ich nämlich auf einen Wert von \(z\geq 3240\) für den Annahmebereich.

3. Das hängt mit dem Zufall zusammen. Wir erwarten bei 4000 Mails, dass 3200 Mails Spam sind. Zufallsbedingt kann es nun aber sein, dass es mehr oder weniger sind. Wir suchen also \(k\), so dass \(P(X\leq k)\leq 5\,\%\). Das ist also jener kritische Wert \(k\), so dass die Wahrscheinlichkeit höchstens 5 % beträgt. In unserem Fall ist \(k=3241\), das bedeutet, dass die Wahrscheinlichkeit, dass höchstens 3241 Mails Spam sind, maximal 5 % beträgt. Diese Grenze liegt natürlich ein kleines bisschen über dem Erwartungswert, da wir ja Schwankungen durch den Zufall durchaus erlauben wollen. Mit einer Wahrscheinlichkeit von höchstens 5 % haben wir aber eben weniger als diese 3241 Spam Mails, was dann gegen die Nullhypothese spricht.

Ich hoffe, das war verständlich. Ansonsten frag nochmal nach.

Danke für die Hilfe, bin wirklich am strugglen mit diesen Aufgaben.


2: Doch, eigentlich müsste wir die noch machen, allerdings bin ich mir gerade unsicher, wegen der Notation, wie und wo ich diese Anwenden muss.

3: Werde ich mir jetzt gleich noch einmal genau durchlesen und bei Unklarheiten noch einmal fragen.


Weitere Fragen:

1: Ich verstehe noch nicht ganz, warum wir bei manchen Aufgaben mit z.b -1.65 und manchmal mit 1.65 als Z Wert rechnen. Ich verstehe dabei schon, dass 1.65 die 95% Wiederspiegeln und der negative Wert die 5%. Ich verstehe es nur nicht wirklich im Zusammenhang mit diesen Textaufgaben. Gibt es da etwas, um mir das herzuleiten ?


Ich werde heute Abend oder morgen noch eine weitere Aufgabe hier online stellen und hoffe nochmals auf Hilfe, dass von der Rechnung bekomme ich so einigermaßen hin, den Textzusammenhang zu verstehen und die passenden Werte daraus abzuleiten fällt mir aber schwer, ich habe manchmal den Eindruck, es ist mehr Raten als verstehen dabei.

Die Stetigkeitskorrektur erfolgt ja im Argument von \(\Phi\). Dort musst du im Zähler entweder \( +0{,}5\) oder \(-0{,}5\) rechnen. Schau da mal in deinen Unterlagen, wann man welchen Fall hat.

Okay, ich verstehe das jetzt so, dass wir +0.5 addieren müssen, wegen dem < Zeichen, bei dem > Zeichen müssten wir -0.5 subtrahieren.

Ja genau so ist es.

Super, ich habe soweit alles korrigiert, hoffe das ist jetzt so richtig. Statistik 2 Kopie 3.jpeg

Text erkannt:

Aufgabe 7 (12 Punkte) Statistik
1) Jana nimmt an einer Umfrage teil, wie viel Prozent der eingehenden Mails Spam-
sind in die folgende Tabelle eingetragen.
\begin{tabular}{|l|l|l|l|l|l|l|l|l|}
\hline Name & Jana & Ahmet & Simon & Maja & Yasmin & Peter & Thomas & Lisa \\
\hline Anzahl & 5 & 20 & 4 & 80 & 7 & 10 & 12 & 4 \\
\hline
\end{tabular}
Bestimmen Sie Modus, Median, arithmetisches Mittel und Stichprobenvarianz zu diesen
Daten. Erläutern Sie mit eigenen Worten, warum Median und arithmetisches Mittel sich so
2) Dem Ersteller der Umfrage erscheint Majas Angabe, dass \( 80 \% \) der bei ihr
eingehenden Mails, Spam sind zu hoch. Daher bittet er sie 5 Monate lang die Anzah
dieses Ergebnis aus, um Majas Angabe (bei einem Konfidenzniveau von \( 95 \% \) )
abzulehnen?
2)
\( \begin{array}{l} n=4000 \quad \varphi=0,8 \\ E\left(S_{4000}\right)=\mu=4000 \cdot 0,8=3200 \\ \operatorname{Var}(x)=0^{2}=n \cdot p \cdot(1-p)=3200 \cdot(1-0,8)=640 \\ x_{i} \sim B(n=4000, p=0,8) \\ P\left(S_{4000} \geq z\right)=P\left(\frac{S_{4000}-3200}{\sqrt{640}} \geq \frac{z-3200}{\sqrt{640}}\right) \\ =1-Q\left(\frac{54000-300}{\sqrt{640}}<\frac{z-3200+0,5}{\sqrt{640}}\right) \\ =1-\left(\frac{2-3200+0.5}{\sqrt{640}}\right) \\ \end{array} \)

Konfidenzniveav: \( 95 \% \)
\( \text { 1- }\left(\frac{z-3200+0,5}{\sqrt{640}}\right)<0,5 \)
\( \Leftrightarrow\left(\frac{z-300+0,5}{\sqrt{640}}\right)>0.95 \)
\( \Leftrightarrow \frac{2-3200+0,5}{\sqrt{640}}>1,65 \)
\( \Leftrightarrow z>3241,24 \)
\( A \text { So }(Z \in \mathbb{N}) Z \geq 3242 \)

Ho ablehnen, wem 3241 oder oeniger Spam Mails eintreffen thlehungsbereich [0,3241] Annahmebereich 3242,4000\( ] \)

0 Daumen

2)

Es handelt sich hier um einen linksseitigen Test

n = 4000 ; p = 0.8

μ = n*p = 3200 ; σ = √(n*p*(1-p)) = 25.30


P-Wert: P(x ≤ 3000) ≈ 0

Das langt um Majas Hypothese, dass 80% der Mails Spam sind abzulehnen.

Avatar von 487 k 🚀

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community