Übungsbeispiele mit R

Question

Übungsbeispiele mit R

Aufgabe:1.5 Übungsbeispiele
1.5.1 Aufgabe 1

Ein Unternehmen produziert Tische. Im Zuge der täglichen Qualitätskontrolle wird die Höhe (in cm ) überprüft und dazu eine Stichprobe der Größe 36 zufällig gezogen:

136.7 136.4 136.1  ??  136.9 136.0 136.0 136.8 136.1
136.0 136.0 134.9 136.0 136.5 134.9 135.3 136.6 138.2
134.4 136.8 136.0 136.7 135.9 136.9 137.1 139.7 134.1
134.6 135.6 137.1 135.9 134.8 135.7 136.2 135.5 137.7

Einer der Messwerte war leider durch einen Kaffeefleck (??) nicht zu entziffern ...
1. Lesen Sie die Daten in \( \mathbf{R} \) ein (z.B. mit scan ()). Belassen Sie für Aufgabe 1 den fehlenden Wert in den Daten und verwenden bei den folgenden Berechnungsfunktionen die Option na. \( \mathrm{rm}= \) TRUE, wo nötig.
24
2. Erstellen Sie ein Histogramm. Setzen Sie bei Bedarf die Breite der X-Achse mit dem Argument \( \times 1 \mathrm{im}=\mathrm{c}(\min , \max ) \). Charakterisieren Sie kurz die Verteilungsform.
3. Berechnen Sie den Mittelwert (MW) und markieren Sie ihn im Histogramm (mittels abline ( \( \mathrm{v}=\mathrm{mw}, \operatorname{col}= \) "red") ). Tragen Sie auch den Wert selbst (gerundet auf eine Nachkommastelle) mittels text ( \( \mathrm{x}=\ldots, \mathrm{y}=\ldots, \mathrm{lab}= \) "MW=...", col = "red") in der Nähe der Linie ein.
4. Berechnen Sie: Wertebereich, Spannbreite und Standardabweichung.
5. Berechnen Sie die 2- \( \sigma \)-Grenzen und tragen Sie diese im Histogramm mittels blauer Linien ein.
1.5.2 Aufgabe 2

Verwenden Sie für diese Aufgabe dieselben Daten wie in Aufgabe 1.
1. Berechnen Sie eine " 5 -Punkt-Zusammenfassung".
2. Entfernen Sie den fehlenden Wert (Hinweis: den Index bekommt man mit which(is.na(daten))).
3. Erstellen Sie einen Boxplot. Erkennt man Ausreißer?
4. Tragen Sie im Diagramm wiederum den Mittelwert ein. Vergleichen Sie ihn mit dem Median. Falls es einen Unterschied gibt, begründen Sie!
5. Berechnen Sie den "Medmed" und vergleichen Sie ihn mit der Standardabweichung.
6. Berechnen Sie den Interquartilsabstand. Was sagt er generell aus? Welche Verbindung gibt es zum Boxplot?

Problem/Ansatz:

Kann jemand die Lösungen dazu auch noch kurz erklären ? Danke !

Gefragt 26 Jan von ivms

Dann solltest du dich nicht mit einer anderen Lösung befassen, sondern mit den Befehlen von R und es ggf. auch mal selbst programmieren. Damit ergibt sich eine solche Lösung nämlich von selbst.

Ansonsten:

Was willst du bei Aufgabe 1.1 wissen? Dort werden nur Daten eingelesen.

Bei 1.2 wird nur ein Histogramm erstellt. Auch dafür gibt es eine Funktion.

Bei 1.3 soll der Mittelwert berechnet werden. Gibt es auch eine Funktion für. Wie der Rest der Aufgabe funktioniert, steht in der Aufgabe selbst.

usw.

Wenn du wirklich etwas lernen willst, setze dich mit R auseinander. Da kommst du nicht drum rum. Programmieren ist etwas Praktisches. Da funktioniert reine Theorie nicht. Spiele mit den Funktionen herum, mit den Argumenten und Parameter und lies in der Doku nach, was diese bewirken. Probiere aus. Dann kommt das mit der Nachvollziehbarkeit ganz von selbst.

Kommentiert 26 Jan von Apfelmännchen

Dann berücksichtige bitte, dass Lösungen auch fehlerhaft sein können. Was hindert sich daran, die Befehle der Lösung einzutippen und zu schauen, ob die das richtige tun? Und was hindert dich dann daran, ylim durch xlim zu ersetzen, um zu schauen, was anders ist?

da ich bei Punkt 2 in der Lösung auf ylim stoße, obwohl in der Aufgabenstellung xlim angegeben ist.

Jedenfalls ist das ja schon einmal eine konkrete Frage. Dazu ist es aber nicht notwendig, dass jetzt hier irgendjemand alle Aufgaben machen muss, zumal die Helfer hier auch Fehler machen können, wer kontrolliert das dann?

aber es wäre hilfreich, die Lösungen für die beiden Aufgaben zu bekommen, um sicherzugehen, dass ich das richtig verstehe.

Das ist nicht logisch, denn die Lösung von jemand anderem kann völlig anders aussehen und dann hast du wieder etwas anderes, was sicherlich nicht zum Verständnis beiträgt.

Fazit für mich: Es besteht kein Interesse, sich mit der angeblich vorhandenen Lösung auseinanderzusetzen, aber man verlangt dennoch, dass man - ohne Arbeit - Verständnis erlangt.

So funktioniert ein Studium nicht und diese Einstellung ist auch für andere Module und Bereiche des Lebens sicherlich nicht hilfreich. Das darfst du gerne als Tipp mitnehmen oder es lassen.

Kommentiert 26 Jan von Apfelmännchen

\# 1.
daten \( <-\operatorname{scan}\left(\right. \) text \( =\left(\begin{array}{lllll}\text { "136.7 } & 136.4 & 136.1\end{array}\right. \) ? ? 136.9
\( 136.0 \quad 136.0 \quad 136.8 \quad 136.1 \quad 136.0 \quad 136.0 \)
\( \begin{array}{lllll}134.9 & 136.0 & 136.5 & 134.9 & 135.3\end{array} \)
136.6138 .2134 .4136 .8136 .0136 .7
\( \begin{array}{lllll}135.9 & 136.9 & 137.1 & 139.7 & 134.1\end{array} \)
\( \begin{array}{llllll}134.6 & 135.6 & 137.1 & 135.9 & 134.8 & 135.7\end{array} \)
136.2 135.5 137.7"),
na.strings = "??")
\# 2 .
hist(daten, freq \( = \) FALSE, labels \( = \) TRUE, ylim =
\( \mathrm{c}(0,0.4) \) )
rug(daten)
\# 3.
mw <- mean (daten, na.rm = TRUE)
abline(v \( =\mathrm{mw}, \mathrm{col}= \) "red")
text(x \( =136.7, \mathrm{y}=0.25, \mathrm{lab}=" \mathrm{MW}=136.2^{\prime \prime}, \mathrm{col}= \)
"red")
\# 4.
range(daten, na.rm = TRUE)
diff(range(daten, na.rm = TRUE))
sd(daten, na.rm = TRUE)
\# 5 .
abline(v \( =m w-2 \) * sd(daten, na.rm \( = \) TRUE), col =
"blue")
abline(v \( =m w+2 \) * sd(daten, na.rm \( = \) TRUE), col =
"blue")
\#---1.5.2.---
\# 1.
summary (daten)
\# 2.
(idx <- which(is.na(daten)))
daten <- daten[-idx]
\# 3. und 4 .
boxplot(daten, horizontal = TRUE)
abline(v = mw, col = "red")
\# 5 .
sd(daten)
mad (daten)
\# 6 .
IQR(daten)

Hier, weil mir hier keiner glaubt.
Ich werde in Zukunft keine Fragen hier jemals stellen.

Kommentiert 27 Jan von ivms

📘 Siehe "Variablen" im Wiki

1 Antwort

Beste Antwort

Fehler: Dateityp „pdf“ ist nicht erlaubt.

Text erkannt:

Statistische Analyse der Tischhöhen

Einleitung
In dieser Arbeit werden zwei Aufgaben zur statistischen Analyse von Tischhöhen durchgeführt. Die Daten bestehen aus 36 Zahlen, von denen eine fehlt (markiert als ??). Wir verwenden R zur Analyse und Visualisierung der Daten.

1 Aufgabe 1
1.1 1.1: Daten einlesen in \( R \)

Die Daten werden mit der Funktion scan() in R eingelesen. Fehlende Werte werden durch NA ersetzt.

daten <- scan(text="
136.7 136.4 136.1 NA 136.9 136.0 136.0 136.8 136.1
136.0 136.0 134.9 136.0 136.5 134.9 135.3 136.6 138.2
134.4 136.8 136.0 136.7 135.9 136.9 137.1 139.7 134.1
134.6 135.6 137.1 135.9 134.8 135.7 136.2 135.5 137.7
")

1.2 1.2: Histogramm erstellen

Ein Histogramm wird mit der Funktion hist () erstellt. Die x-Achsen-Grenzen werden unter Berücksichtigung der fehlenden Werte gesetzt.
hist(daten, \( x \lim =c(\min ( \) daten, na.rm \( =T R U E), \max ( \) daten, na. \( r m=T R U E)) \), main \( = \) "Histogramm der Tischhöhen", xlab \( = \) "Höhe (cm)")

Die Verteilung zeigt eine annähernd normale Form mit möglichem leichten Rechtsschief.
1

Text erkannt:

1.3 1.3: Mittelwert und Markierung im Histogramm

Der Mittelwert wird berechnet und im Histogramm markiert.

mw <- mean(daten, na.rm = TRUE)
rounded_mw <- round(mw, 1)
abline(v = mw, col = "red")
text(x = mw, y = 0, labels = paste("MW =", rounded_mw), col = "red", pos = 4)

1.4 1.4: Werterbereich, Spannbreite und Standardabweichung
range(daten, na.rm = TRUE) \# Werterbereich
diff(range(daten, na.rm = TRUE)) \# Spannbreite
sd(daten, na.rm = TRUE) \# Standardabweichung
1.5 1.5: 2-Sigma-Grenzen

Die 2-Sigma-Grenzen werden berechnet und im Histogramm eingezeichnet.
sigma <- sd(daten, na.rm = TRUE)
lower <- mw - \( 2 * \) sigma
upper <- mw + 2 * sigma
abline(v = c(lower, upper), col = "blue")
2 Aufgabe 2
2.1 2.1: 5-Punkt-Zusammenfassung

Die 5-Punkt-Zusammenfassung wird mit der Funktion summary() erstellt.
summary (daten_clean)
2.2 2.2: Fehlenden Wert entfernen

Der fehlende Wert wird entfernt.
daten_clean <- na.omit(daten)
2

Text erkannt:

2.3 2.3: Boxplot und Ausreißer

Ein Boxplot wird erstellt, um Ausreißer zu identifizieren.
boxplot(daten_clean, main = "Boxplot der Tischhöhen", ylab = "Höhe (cm)")
2.4 2.4: Mittelwert vs. Median

Der Mittelwert wird zum Boxplot hinzugefügt.
abline(h = mean(daten_clean), col = "red")
2.5 2.5: Medmed vs. Standardabweichung

Der Median Absolute Deviation wird berechnet.
mad(daten_clean)
2.6 2.6: IQR und Boxplot-Verbindung

Der Interquartilsabstand (IQR) wird berechnet und im Boxplot dargestellt.
IQR <- IQR(daten_clean)
Zusammenfassung
Aufgabe 1 fokussiert auf deskriptive Statistik und Visualisierung. Aufgabe 2 analysiert robuste Statistiken (Median, IQR) und identifiziert Ausreißer. Die Daten zeigen eine leichte Schiefe mit einem potenziellen Ausreißer bei 139.7 cm . Mittelwert und Median liegen nahe beieinander, was auf eine geringe Schiefe hindeutet.
3

Beantwortet 24 Feb von CABLord

Ein anderes Problem?

Stell deine Frage

Übungsbeispiele mit R

1 Antwort

Ähnliche Fragen

Eingabetools:

Beliebte Fragen:

Heiße Lounge-Fragen: