Fehler: Dateityp „pdf“ ist nicht erlaubt.
Text erkannt:
Statistische Analyse der Tischhöhen
Einleitung
In dieser Arbeit werden zwei Aufgaben zur statistischen Analyse von Tischhöhen durchgeführt. Die Daten bestehen aus 36 Zahlen, von denen eine fehlt (markiert als ??). Wir verwenden R zur Analyse und Visualisierung der Daten.
1 Aufgabe 1
1.1 1.1: Daten einlesen in \( R \)
Die Daten werden mit der Funktion scan() in R eingelesen. Fehlende Werte werden durch NA ersetzt.
daten <- scan(text="
136.7 136.4 136.1 NA 136.9 136.0 136.0 136.8 136.1
136.0 136.0 134.9 136.0 136.5 134.9 135.3 136.6 138.2
134.4 136.8 136.0 136.7 135.9 136.9 137.1 139.7 134.1
134.6 135.6 137.1 135.9 134.8 135.7 136.2 135.5 137.7
")
1.2 1.2: Histogramm erstellen
Ein Histogramm wird mit der Funktion hist () erstellt. Die x-Achsen-Grenzen werden unter Berücksichtigung der fehlenden Werte gesetzt.
hist(daten, \( x \lim =c(\min ( \) daten, na.rm \( =T R U E), \max ( \) daten, na. \( r m=T R U E)) \), main \( = \) "Histogramm der Tischhöhen", xlab \( = \) "Höhe (cm)")
Die Verteilung zeigt eine annähernd normale Form mit möglichem leichten Rechtsschief.
1

Text erkannt:
1.3 1.3: Mittelwert und Markierung im Histogramm
Der Mittelwert wird berechnet und im Histogramm markiert.
mw <- mean(daten, na.rm = TRUE)
rounded_mw <- round(mw, 1)
abline(v = mw, col = "red")
text(x = mw, y = 0, labels = paste("MW =", rounded_mw), col = "red", pos = 4)
1.4 1.4: Werterbereich, Spannbreite und Standardabweichung
range(daten, na.rm = TRUE) \# Werterbereich
diff(range(daten, na.rm = TRUE)) \# Spannbreite
sd(daten, na.rm = TRUE) \# Standardabweichung
1.5 1.5: 2-Sigma-Grenzen
Die 2-Sigma-Grenzen werden berechnet und im Histogramm eingezeichnet.
sigma <- sd(daten, na.rm = TRUE)
lower <- mw - \( 2 * \) sigma
upper <- mw + 2 * sigma
abline(v = c(lower, upper), col = "blue")
2 Aufgabe 2
2.1 2.1: 5-Punkt-Zusammenfassung
Die 5-Punkt-Zusammenfassung wird mit der Funktion summary() erstellt.
summary (daten_clean)
2.2 2.2: Fehlenden Wert entfernen
Der fehlende Wert wird entfernt.
daten_clean <- na.omit(daten)
2

Text erkannt:
2.3 2.3: Boxplot und Ausreißer
Ein Boxplot wird erstellt, um Ausreißer zu identifizieren.
boxplot(daten_clean, main = "Boxplot der Tischhöhen", ylab = "Höhe (cm)")
2.4 2.4: Mittelwert vs. Median
Der Mittelwert wird zum Boxplot hinzugefügt.
abline(h = mean(daten_clean), col = "red")
2.5 2.5: Medmed vs. Standardabweichung
Der Median Absolute Deviation wird berechnet.
mad(daten_clean)
2.6 2.6: IQR und Boxplot-Verbindung
Der Interquartilsabstand (IQR) wird berechnet und im Boxplot dargestellt.
IQR <- IQR(daten_clean)
Zusammenfassung
Aufgabe 1 fokussiert auf deskriptive Statistik und Visualisierung. Aufgabe 2 analysiert robuste Statistiken (Median, IQR) und identifiziert Ausreißer. Die Daten zeigen eine leichte Schiefe mit einem potenziellen Ausreißer bei 139.7 cm . Mittelwert und Median liegen nahe beieinander, was auf eine geringe Schiefe hindeutet.
3