0 Daumen
705 Aufrufe

Liebe Lounge, ich habe eine Frage zu Quartilen und Boxplots.


Nehmen wir einmal ein einfaches Beispiel einer Datenliste:

1 2 2 2 2 2 3 5.

Mit Kenngrößen versehen:

1 2 Q1 2 2 Q2 2 2 Q3 3 5.


Meine Frage bezieht sich eigentlich lediglich auf eine Größenangabe der Quartile. Man findet beispielsweise Aussagen wie:

Q1: 25% der Werte des Datensatzes sind kleiner oder gleich diesem Wert.

Dort entsteht für mich die erste Unklarheit: Es gilt Q1 = 2. Kleiner 2 wäre in diesem Datensatz nur die 1, also nicht 25%. Kleiner oder gleich 2 wären jedoch 6 der 8 Werte, also 75%.

Oder lese ich diese Eigenschaft falsch? Bedeutet das eher: Unser Q1 ist 2. Q1 liegt zwischen Rang 2 und 3. Deshalb gilt die Aussage, dass 2 der 8 Werte (nur Rang 1 und Rang 2) eine "kleinere Position" haben als Q1?


Ich hoffe die Unklarheit wird deutlich und bedanke mich für eure Antworten!

LG

Kombinatrix

Avatar von

1 Antwort

0 Daumen

Q1: 25% der Werte des Datensatzes sind kleiner oder gleich diesem Wert.


Das untere Quartil (Viertel) ist definiert als der kleinste Wert der Datenreihe, für den gilt: mindestens 25 % der Daten sind <= dem unteren Quartil und höchstens 75 % der Daten sind > dem unteren Quartil.

fehlt da nicht das Wort "mindestens".

Ich kenne es nur so:

Das untere Quartil (Viertel) ist definiert als der kleinste Wert der Datenreihe, für den gilt:

Mindestens 25 % der Daten sind <= dem unteren Quartil und

höchstens 75 % der Daten sind > dem unteren Quartil.

Avatar von 289 k 🚀

Hmm. Könnte man es auch so formulieren:


Ca. 25% der kleinsten Datenwerte haben einen Wert, für den gilt, dass er kleiner oder gleich des Wertes von Q1 ist. Das stimmt ja in der Beispieldatenreihe sogar genau (es sind nämlich 1 und 2 kleiner gleich 2. Somit gilt auf jeden Fall für 25% der Werte, dass sie die obige Eigenschaft haben. Dass es auch für mehr Wert gilt, wäre dann an dieser Stelle zweitrangig?)


Allerdings müsste man dann als Relativierung formulieren:

Umso häufiger bspw. der Wert des unteren Quartils in der Datenreihe auftritt, desto ungenauer wird die Aussagekraft des unteren Quartils.

Im obigen Beispiel: Die Aussage, dass in der Erhebung ca. 25% der Daten kleiner oder gleich dem Wert 2 sind, ist äußert ungenau, da der tatsächliche Wert hierfür 75% wären.


Stimmt das so?

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community