+1 Daumen
811 Aufrufe

Aufgabe:

Um Heimvorteil im Fußball aufzuzeigen, sind zwei metrische Größen gesucht , die dann überprüfen können , ob ein Heimvorteil innerhalb einer Liga vorliegt.



Problem/Ansatz:

Welche metrischen Größen könnte man in einer linearen Regression dafür nehmen?

Ich hätte als x die gewonnen Heimpunkte und als y die gesamtgewonnen Punkte genommen.

Allerdings würde man diese beiden metrischen Größen prüfen , würde man wohl nur herausfinden , dass Mannschaften die insgesamt viele Punkte gewinnen auch zuhause viele Punkte gewinnen.

Einen Heimvorteil könnte man wohl eher nicht prüfen.

Avatar von
Ich hätte als x die gewonnen Heimpunkte und als y die gesamtgewonnen Punkte genommen.

1. Das scheint mir gar nicht so schlecht. Willst du verschiedene Mannschaften untersuchen?

Ist lineare Regression als Methode vorgegen?

2. Was wäre mit y = ( die gewonnen Heimpunkte) / ( die gesamtgewonnen Punkte)?

x gespielte Spiele ?

Wechseln sich Heimspiele und Auswärtsspiele regelmässig ab?

Ja die lineare Regressions Methode ist vorgeschrieben.

Ich muss insgesamt in drei verschiedenen Internationalen Ligen(am besten die altuell drei erfolgreichsten Ligen) , den Heimvorteil aufzeigen.

Es muss auch nicht extrem aufwenig sein, würde eventuell die Saison 17/18 der deutschen,spanischen und englischen Ersten Liga wählen.

Die Daten würden aus der kicker.de Anschlusstabelle 17/18 der europäischen Topligen stammen.

Interessanter Ansatz.

Mit y ( g. Heimpunkte/ g.Gesamtpunkte

x = Gesamtspiele.

Inwiefern lässt sich dann ein Heimvorteilnaufzeigen ?Bzw. würde den gerprüft werden wenn man deine beiden genannten metrischen Größen überprüft ?

Die gespielten Spiele sind dann nicht mehr interessant, da die Ligen vermutlich nicht gleich viele Spiele spielen. Für x müsste ich dann etwas anderes finden.

Ich vermute zudem, dass die Stadien entscheidender sind als jeweils eine Gesamtliga.

Die Englische , spanische und italienische Liga haben jeweils gleich viele Spiele in der Liga.

Ja andere Einflussfaktoren , sollen zunächst ausgeblendet werden , ein Zusammenhang ist praktisch zweifelsfrei gegeben, weil Heimmannschaften in der Regel mehr Punkte und Tore zuhause erzielen als auswärts.


Also hat jemand eine Idee für die metrischen Größen um es in der linearen Regressionsmethode zuprüfen ?

2. Was wäre mit y = ( die gewonnen Heimpunkte) / ( die gesamtgewonnen Punkte)?

So bekommst du somit nur drei Zahlen? Je eine pro Liga? (einen Durchschnitt).

Verfeinerung wäre: Eine Zahl für jede Mannschaft? Dann kannst du schauen, wie stark das je Liga streut.

Die Englische , spanische und italienische Liga haben jeweils gleich viele Spiele in der Liga.

D.h. du hast noch nichts vernünftiges auf der x-Achse. Allenfalls einfach: Liga 1, Liga 2, Liga 3.

Zurück zu deiner Idee: Sie hat wenigstens zwei klare Achsen.

x die gewonnen Heimpunkte und als y die gesamtgewonnen Punkte genommen.

Zeichne diese Zahlen doch mal auf. Kannst du durch sie (ungefähr) eine Gerade legen? Wenn ja, könntest du damit lineare Regression machen.

So weit von meiner Seite. Mal schauen, ob jemandem eine Antwort einfällt.

1 Antwort

0 Daumen

Ich würde nicht nach Toren gehen sondern nach
Punkten.
Bundesliga für 1 Mannschaft in der Saison
Beispiel
Punkte
Heimspiele 12
Unentschieden 4
Auswärts 6

Klarer Fall von Heimvorteil

Ich weiß aber nicht ob es so etwas in internationalen
Ligen auch gibt bzw. wie Sieg / Unentschieden /
Niederlage gewertet werden.

Die ursprünglichste Tabelle wäre wohl die Tore als
Maßstab zu nehmen

Was willst du nehmen ?

Frage : wozu dient das Ganze ?

mfg Georg

Avatar von 123 k 🚀

Ihre Variablen sind metrisch, aber der Zusammenhang ist nicht der, den Sie Heimstärke nennen.

Als Beispiel: Nehmen wir einmal an, bei allen Vereinen wäre die Anzahl der Heimpunkte exakt die Hälfte der Gesamtpunkte.


Bei der Regression käme heraus: Heimpunkte = 0,5 X Gesamtpunkte, der Korrelationskoeffizient wäre 1. Was würden Sie in Bezug auf die

Heimstärke von Mannschaften daraus ableiten?


Hier kommt es also gar nicht auf den hohen Korrelationskoeffizienten an, eher auf die Steigung der Regressionsgeraden: Liegt sie deutlich über

0.5, gibt es einen Heimvorteil, läge sie deutlich unter 0.5, gäbe es sogar einen Heimnachteil.


Mit dieser Interpretation ist es schon möglich, das mit einer linearen Regression zu prüfen, der Korrelationskoeffizient und das Streudiagramm reichen hier aber

nicht aus. Das liegt, wie schon beschrieben, daran, dass die Tatsache Heim/Auswärts, um die es Ihnen geht, denn doch nicht metrisch, sondern nominal ist.



Was willst du berechnen ?
Tore bei Heimspielen / Auswärtsspielen ?
z.B. ausgewertet
60 % : 40 %
Willst du Toto-Tippen ?

 Nein es soll eine HA werden, dass muss schon einwenig empirischer berechnet werden und unser Dozent möchte , das wir die linerare Regression anwenden.

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community