0 Daumen
558 Aufrufe

Aufgabe:

Thema: Pünktlichkeit der Deutschen Bahn

Stellen Sie sich vor, Sie müssten tãglich für lhren Weg zur Schule eine Regionalbahn der Deutschen Bahn nutzen. Die Deutsche Bahn gibt monatlich eine Pünktlichkeitsstatistik heraus, diese kann im Internet abgerufen werden

https://www.deutschebahn.com/de/konzern/konzernprofil/zahlen_fakten/puenktlichkeitswerte-6878476# (Zugriff 15.10.2024)

1) Ermitteln Sie unter Verwendung dieser Daten und weiterer nötiger Recherchen und Annahmen die Wahrscheinlichkeit,

- mindestens einmal im Monat aufgrund der Verspätung der Bahn verspätet zum Unterricht zu erscheinen.

- vier Mal im Monat (also durchschnittlich einmal pro Woche) verspätet zu sein.

Beurteilen Sie lhre Ergebnisse im Sachzusammenhang.

2) Überlegen Sie, wie oft Sie im letzten Monat verspätet waren. Prüfen Sie dann mit geeigneten Berechnungen, ob lhre Pünktlichkeit signifikant bzw. hochsignifikant von der Pünktlichkeit der Deutschen Bahn abweicht.


Problem/Ansatz:

Ich weiß nicht, welche Daten ich in welche Formel für die jeweiligen Aufgaben einsetzen soll. Bzw., welche genauen Daten, welche in der Website der Deutschen Bahn hinterlassen wurden, ich wie genau übernehmen soll...

Avatar von

Für "verspätet" gilt die Gegenwahrscheinlichkeit von "pünktlich".


Für 1)

Verwende die Binomialverteilung mit n = 20 Unterrichtstagen monatlich.


Für 2)

Wie oft fährst Du im Monat (ohne Semesterferien) zum Unterricht?

Wie oft warst Du im letzten Monat (ohne Semsterferien) verspätet?


In der verlinkten Tabelle steht, dass folgende Wahrscheinlichkeiten für "pünktlich" (weniger als 6 Minuten Verspätung) gemessen wurden:

Juli 2024: 90,2 %
August 2024: 90,7 %
September 2024: 89,2 %

(beim Fernverkehr um die 62 %)

Randbemerkung: Bei den Schweizerischen Bundesbahnen SBB ist die Definition von "pünktlich" bei weniger als 3 Minuten, und die aktuelle Zahl liegt inkl. Fernverkehr bei 93,8 % weil gerade besonders viel gebaut wird am Schienennetz.

Danke erstmal für die Angaben!

Auf der angegeben Seite sind jedoch die Pünktlichkeit von verschiedenen "Arten" von Verkehrsmitteln angegeben.

Auszuschließen ist dabei der Fernverkehr, da man mit dem Personenverkehr oder Nahverkehr "anreist".

Meine Frage lautet demnach, ob ich für die Aufgabe 1 und 2 für "p" die Wahrscheinlichkeiten aus der Zeile "Betriebliche Pünktlichkeit Personenverkehr" oder "Betriebliche Pünktlichkeit Nahverkehr" entnehmen und einsetzen soll.

Und aus welchem Grund...

Für den Nahverkehr gibt es auf der Webseite nur eine Zeitreihe.

Und ich habe noch den Link geflickt, damit man die Seite besser findet.

Was ist mit der Aufgabe 2? Denn wenn ich da festlege 7mal verspätet zu erscheinen, wüsste ich nicht, wie ich da prüfen kann, ob meine Pünktlichkeit signifikant bzw. Hochsignifikant von der Pünktlichkeit der Deutschen Bahn abweicht. Habt ihr da eine Idee, wie ich vorgehen kann?

Für den Nahverkehr gibt es auf der Webseite nur eine Zeitreihe.

Meinst du damit ich soll die Wahrscheinlichkeiten aus der Reihe "Betriebliche Pünktlichkeit Nahverkehr" entnehmen?

Zur Aufgabe 2 hast Du nur eine von zwei meiner Nachfragen beantwortet. Wenn Dir eine Anwort zur zweiten Nachfrage eingefallen ist, könntest Du damit anfangen, mit einer Wahrscheinlichkeit aus der DB-Tabelle und der Binomialverteilung für n monatliche Fahrten zum Unterricht auszurechnen, wie hoch jeweils die Wahrscheinlichkeit für 0 bis n Verspätungen ist. Die Summe dieser Wahrscheinlichkeiten muss 100 % betragen.

Zur Zeitreihe, ja das meine ich, weil es die einzige Zeitreihe zum Nahverkehr ist.

Wie oft fährst Du im Monat (ohne Semesterferien) zum Unterricht?

n=20

Wie oft warst Du im letzten Monat (ohne Semsterferien) verspätet?

k=7

wie hoch jeweils die Wahrscheinlichkeit für 0 bis n Verspätungen ist. Die Summe dieser Wahrscheinlichkeiten muss 100 % betragen.

Meinst du hier, dass auf DB die Wahrscheinlichkeit für z.B. 31 Tage (also n=31 ist) und ich die Wahrscheinlichkeit für n=20 Tage einsetzen soll und diese 100% ergeben soll? Hätte ich das für die Aufgabe 1 auch machen sollen? Da habe ich nämlich einfach die Daten aus der Tabelle genommen...und als gegenwahrscheinlichkeit verwendet...

Nein, das meine ich nicht. Die Wahrscheinlichkeit, jeweils pünktlich oder verspätet anzukommen, bezieht sich nicht auf die Anzahl Fahrten. Denn sie ist die relative Häufigkeit, nicht die absolute.

Hingegen beziehen sich Deine 7 Verspätungen (absolute Häufigkeit) auf 20 Fahrten. Darum hatte ich nach der Anzahl Fahrten gefragt.

Die von mir erwähnte Tabelle für 0 bis 20 Verspätungen bei 20 Fahrten, bei einer Verspätungswahrscheinlichkeit von 10 %:

blob.png

Alles klar, da habe ich jetzt die 100% erhalten. Aber ganz verstanden habe ich jetzt nicht, Inwiefern mir das jetzt weiterhelfen soll bzw. Was ich als nächstes machen kann, um zu prüfen, ob meine Pünktlichkeit signifikant oder hochsiknifikant abweicht von der Pünktlichkeit der DB...

Ich würde als Nullhypothese das wählen, was Du im Fall einer signifikanten (95 %) oder hochsignifikanten (99 %) Abweichung Deiner Pünktlichkeit verwerfen würdest, also die auf der Webseite publizierte Pünktlichkeit der Deutschen Bahn.

Naja, wenn ich jetzt also für den Monat August das ganze prüfen würde, nehme ich für Pünktlichkeit der DB die p=0,899. Dann wäre ja aber trotzdem meine Pünktlichkeit an 13Tagen bzw. Verspätung an 7Tagen. Soll meine Nullhypothese H0 jetzt lauten, meine Pünktlichkeit weicht signifikant ab von der der DB? Oder eher, dass meine Pünktlichkeit bei p=0,899 liegt? Das verstehe ich gerade nicht und auch nicht in welchem Zusammenhang ich das zusammenstellen kann... wie lautet dann die Alternative?

Oder meinst du es so?

Nullhypothese (h0): Deine Verspätungsquote ist dieselbe wie die der Deutschen Bahn (0,101). Alternativhypothese (h1): Deine Verspätungsquote ist größer als die der Deutschen Bahn (einseitiger Test).

Erwartete Verspätungsquote(0,101). Meine verspätungsquote: 7/20... 0,35

... für den Monat August das ganze prüfen würde, nehme ich für Pünktlichkeit der DB die p=0,899

Diese Quote ist nicht für Nahverkehr.

Soll meine Nullhypothese H0 jetzt lauten, meine Pünktlichkeit weicht signifikant ab von der der DB?

Nein. Sondern eher so wie in Deinem zweiten Kommentar. Allerdings verstehe ich dort nicht, wie Du auf einen einseitigen Test kommst. In der Aufgabe wird nach "abweicht" gefragt. Es könnte ja auch sein, dass jemand pünktlicher ankommt als der publizierte Durchschnitt.

Falls Du meinen Computeroutput verwenden möchtest: Addiere die ersten 7 Zahlen auf der Liste. Das ergibt die Wahrscheinlichkeit, dass Du mit den Werten auf der DB-Webseite (von mir auf 90 % gerundet) 0 bis 6 mal verspätet bist bei 20 Fahrten. Du bist 7 mal verspätet.

Allerdings verstehe ich dort nicht, wie Du auf einen einseitigen Test kommst. In der Aufgabe wird nach "abweicht" gefragt. Es könnte ja auch sein, dass jemand pünktlicher ankommt als der publizierte Durchschnitt.

Alles klar, also würdest du als Alternative dann annehmen, dass meine Verspätungsquote größer oder kleiner ist, als die der DB?

Und dementsprechend dann für H0=p0=0,093 und für H1=p1=0,907?

Was nehme ich dann als Signifikanzniveau?

Falls Du meinen Computeroutput verwenden möchtest: Addiere die ersten 7 Zahlen auf der Liste. Das ergibt die Wahrscheinlichkeit, dass Du mit den Werten auf der DB-Webseite (von mir auf 90 % gerundet) 0 bis 6 mal verspätet bist bei 20 Fahrten. Du bist 7 mal verspätet.

Ich verstehe tatsächlich immernoch nicht ganz, Inwiefern dies mich zum Ergebnis bringt? Könntest du das einmal erläutern?

Was nehme ich dann als Signifikanzniveau?

Dazu habe ich gestern geschrieben:

... im Fall einer signifikanten (95 %) oder hochsignifikanten (99 %) Abweichung


Mach halt das was ich geschreiben habe, nämlich

Addiere die ersten 7 Zahlen auf der Liste.
Addiere die ersten 7 Zahlen auf der Liste.
Addiere die ersten 7 Zahlen auf der Liste. Das ergibt die Wahrscheinlichkeit, dass Du mit den Werten auf der DB-Webseite (von mir auf 90 % gerundet) 0 bis 6 mal verspätet bist bei 20 Fahrten. Du bist 7 mal verspätet.

Hab ich jetzt gemacht...Warum aber von 0-6? Und nicht von 0-7?

Habe ich das aber richtig verstanden, dass ich zwei Tests "durchführen" muss? Also für die jeweiligen Signifikanzniveaus...

Ich nehme an, Du bist auf etwa 99,76 % gekommen? Für was das die Wahrscheinlichkeit ist, hatte ich geschrieben und Du jetzt gerade mit dem letzten Kommentar wiedergegeben. Aber Du hast 7 Verspätungen. Die Wahrscheinlichkeit für 7 und mehr Verspätungen ist (bei 90 % pünktlich und 20 Fahrten) also kleiner als 1 %.

Hab ich jetzt nicht ganz verstanden, was soll der Wert heißen? Soll ich das jetzt nochmal neu machen, was du für 0-6 gemacht hast für 0-7? Und was sgt der Wert dann aus?

Was haben dann die 100%, welche errechnet wurden damit zu tun? Also ja verstehe schon, das es von 0-20=100 ergeben muss, aber jetzt im Gesamten?...

Hab ich jetzt nicht ganz verstanden, was soll der Wert heißen?

Das was ich geschrieben habe und Du wiederholt hast. Ich bin nicht in der Lage, es anders zu formulieren.

Soll ich das jetzt nochmal neu machen, was du für 0-6 gemacht hast für 0-7?

Nein.

Und was sgt der Wert dann aus?

Es wäre die Wahrscheinlichkeit, dass Du mit den Werten auf der DB-Webseite (von mir auf 90 % gerundet) 0 bis 7 mal verspätet bist bei 20 Fahrten.

Was haben dann die 100%, welche errechnet wurden damit zu tun? Also ja verstehe schon, das es von 0-20=100 ergeben muss, aber jetzt im Gesamten?...

Ich verstehe diese letzten beiden Fragen nicht.

Soll das (also der Wert) heißen, dass meine Pünktl hochsignifikant von der Pünktlichkeit der DB abweicht, da man 99,7 erhält? Und es also ca. 1% sind und nicht 5, sodass es "nur" signifikant abweicht?

Ich verstehe diese letzten beiden Fragen nicht.

Ich wollte einfach nur den Zusammenhang, den ich gerade in diesem Post schreibe bestätigt haben...

Soll das (also der Wert) heißen, dass meine Pünktl hochsignifikant von der Pünktlichkeit der DB abweicht, da man 99,7 erhält?

Ja. Aber 99,76 sind eher 99,8 als 99,7.

Und es also ca. 1% sind und nicht 5, sodass es "nur" signifikant abweicht?

Nein. "Hochsignifikant" ist signifikanter als "nur signifikant". Und 100 % - 99,76 % ist nicht ca 1 % sondern ca. 0,24 %.

Zu welchem Ergebnis kommt man dann? Denn meine Verspätungsquote ist ja jetzt größer als die der DB...ist es also Signifikant oder hochsiknifikant?

Und, ach ja da hätte ich genauer bei der Angabe sein müssen...

Ist es dann so, dass die Nullhypothese verworfen wird, da sie falsch ist? Ja oder?

ist es also Signifikant oder hochsiknifikant?

Du hast diese Frage doch in Deinem Kommentar davor gestellt und ich mit "Ja" beantwortet?

Es gibt eine Wahrscheinlichkeit von ca. 0,24 % für 7 oder mehr Verspätungen unter der Nullhypothese.

Ist es dann so, dass die Nullhypothese verworfen wird

Ja.

... da sie falsch ist?

Nein, sondern weil es unter ihr nur eine sehr kleine Wahrscheinlichkeit für das beobachtete Ereignis "mehr als 6 Verspätungen" gibt.

Okay, aber die Berechnungen beruhen alle auf die Nullhypothese, dass meine Verspätungsquote dieselbe ist, wie die der DB und der alternative, das meine Verspätungsquote größer oder kleiner ist, als die der DB?

Was ist dann mit Annahme und Ablehnungsbereichen? Ist das hier relevant?...

die Berechnungen beruhen alle auf die Nullhypothese, dass meine Verspätungsquote dieselbe ist, wie die der DB und der alternative, das meine Verspätungsquote größer oder kleiner ist, als die der DB?

Ja.

Was ist dann mit Annahme und Ablehnungsbereichen? Ist das hier relevant?..

Jetzt haben wir doch gerade herausgefunden, dass "mehr als 6 Verspätungen" mit etwa 99,78 % signifikant abweicht von der Nullhypothese, also im Ablehnungsbereich liegt.

1 Antwort

0 Daumen

1)

mindestens einmal im Monat aufgrund der Verspätung der Bahn verspätet zum Unterricht zu erscheinen.

Ich nähme den Mittelwert m aus allen Monaten und 22 Schultage.

P(X>=1) = 1- P(X=0) = 1- m^22

P(X=4) = m^4


Avatar von 1,6 k

Ermitteln Sie unter Verwendung dieser Daten und weiterer nötiger Recherchen und Annahmen die Wahrscheinlichkeit,

Man muss zumindest das Kleingedrückte auf der Seite lesen.

In der betrieblichen Pünktlichkeit gehen z.B. keine komplett ausgefallenen Züge ein.

Und die Reisendenpünktlichkeit schließt auch den Fernverkehr ein. In Hamburg fährt die S-Bahn noch sehr regelmäßig, aber die Regionalbahn ist katastrophal.

Die Frage ist also, was bedeutet es die Bahn zu nehmen.

Und ab welcher Verspätungszeit ist man verspätet im Unterricht?

Ich nähme ...

P(X=4) = m4

Das wäre die Wahrscheinlichkeit für 4 bestimmte Tage pünktlich, nicht die Wahrscheinichkeit für irgendwelche 4 Tage verspätet.

Ich hatte drei Stunden vor Deiner Antwort geschrieben:

Verwende die Binomialverteilung

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community