0 Daumen
1,6k Aufrufe

Ich benötige eine Regressionsfunktion ( nicht linear )
für die Fallzahlen der Coronaepidemie
Quadratisch genügt vielleicht schon.

0 43165 
1 48884 
2 54238 
3 58639 
4 62526 
5 67074 

mfg Georg

Avatar von 123 k 🚀

Oder wie ich obige Werte in ein
Internet Mathe Programm eingeben
( z.B. Arndt Brünner ) kann

Guten Morgen Georg,

da scheint mit eine lineare Regression angemessen:

blob.png

Nein.
Eine lineare Funktion hätte nach oben keine
Begrenzung.
Die gewählte Funktion muß im weiteren
Verlauf einen Hochpunkt haben.

Mit quadratischer Regression kommt dieser Graph heraus:

~plot~ {0|43165};{1|48884};{2|54238};{3|58639};{4|62526};{5|67074};-209.339285714282x^2+5757.32499999998x+43279.9642857143; [[0|35|0|100000]] ~plot~

Schön.

Mit welchem Hilfsprogramm hast du gearbeitet ?

Ich bräuchte ein einfach zu bedienendes ( Internet ) Programm mit
Werte ( x | y ) eingeben - Knöpfchen drücken -
Ausgleichsparabel als Ergebnis zurück

Habe das mit SciDAVis gemacht. Funktioniert recht einfach, wenn man weiß, wo man drücken muss.

2 Antworten

0 Daumen
 
Beste Antwort

Aloha Gerog ;)

Aus dem Ansatz$$f(x)=ax^2+bx+c$$und den Wertepaaren \((x,f(x))\) erhalten wir folgendes LGS:

$$\begin{array}{r}43165&=&0\cdot a&+&0\cdot b&+&1\cdot c\\48884&=&1\cdot a&+&1\cdot b&+&1\cdot c\\54238&=&4\cdot a&+&2\cdot b&+&1\cdot c\\58639&=&9\cdot a&+&3\cdot b&+&1\cdot c\\62526&=&16\cdot a&+&4\cdot b&+&1\cdot c\\67074&=&25\cdot a&+&5\cdot b&+&1\cdot c\end{array}$$Da es überbestimmt ist, kannst du die Näherungslösung gemäß der Methode der kleinsten Fehlerquadrate berechnen:$$\left(\begin{array}{c}0 & 1 & 4 & 9 & 16 & 25\\0 & 1 & 2 & 3 & 4 & 5\\1 & 1 & 1 & 1 & 1 &1\end{array}\right)\left(\begin{array}{c}0 & 0 & 1\\1 & 1 & 1\\4 & 2 & 1\\9 & 3 & 1\\16 & 4 & 1\\25 & 5 & 1\end{array}\right)\left(\begin{array}{c}a\\b\\c\end{array}\right)=\left(\begin{array}{c}0 & 1 & 4 & 9 & 16 & 25\\0 & 1 & 2 & 3 & 4 & 5\\1 & 1 & 1 & 1 & 1 &1\end{array}\right)\left(\begin{array}{c}43165\\48884\\54238\\58639\\62526\\67074\end{array}\right)$$$$\left(\begin{array}{c}979 & 225 & 55\\225 & 55 & 15\\55 & 15 & 6\end{array}\right)\left(\begin{array}{c}a\\b\\c\end{array}\right)=\left(\begin{array}{c}3470853\\918751\\334526\end{array}\right)$$$$\left(\begin{array}{c}a\\b\\c\end{array}\right)=\left(\begin{array}{c}979 & 225 & 55\\225 & 55 & 15\\55 & 15 & 6\end{array}\right)^{-1}\left(\begin{array}{c}3470853\\918751\\334526\end{array}\right)=\left(\begin{array}{c}-209,3393\\5757,325\\43279,9643\end{array}\right)$$Das kann man ganz gut in Excel schematisieren und berechnen lassen.

Avatar von 152 k 🚀

Hallo Tschaka,
schönen Dank für deinen Beitrag.
Ich habe mein Turbo-/Borland Pascal wieder hervorgeholt (DOS)
und ein Regressions-Parabel Programm geschrieben.
Deine Werte wurden bestätigt.

+1 Daumen

Üblicherweise wird sowas mit einem Epedemiemodell gelöst, z.B. einem SIR oder SIRD Modell, siehe

https://de.m.wikipedia.org/wiki/SIR-Modell

Die nötigen Daten kann man hier downloaden

https://data.humdata.org/m/dataset/novel-coronavirus-2019-ncov-cases

Mit linearer Regression kommt man sicher nicht weiter.

Avatar von 39 k

Meiner Meinung nach ist das große Problem das Bestimmen der Parameter der Dgl.

Hallo Ulli,
die von dir vorgeschlagene Methode ist
mir zu aufwendig.

Ich informiere mich über

https://www.n-tv.de/infografik/Coronavirus-aktuelle-Zahlen-Daten-zur-Epidemie-in-Deutschland-Europa-und-der-Welt-article21604983.html

und dort die Coronafallzahlen die in
meiner Frage aufgeführt sind.
Genauer braucht es nicht zu sein.

Balkendiagramm - Fälle in Deutschland

Dann wird das Ergebnis aber auch entsprechend ausfallen. Das siehst Du ja schon an der linearen Korrelation die gut passt, aber absolut sinnlos ist.

Der Verlauf der Epidemie ist nicht 100 %
mathematisch.

Gestern gab es zum Beispiel einen Ausreißer.

Also alles auf die 7.Stelle hinter dem Komma
berechnen zu wollen ist sinnlos.

Eine Regressionsparabel ist vielleicht
schon ausreichend. Das muß man mal ausprobieren.

Zum SIR Modell gibt es ein sehr schönes Beispiel mit ggb

https://www.youtube.com/watch?v=k6nLfCbAzgo

Es geht nicht um die siebte Stelle nach dem Komma, sondern um eine sinnvolle Modellierung des gesamten Epedemieprozess. Im einfachen SIR Modell ist auf jeden Fall gesichert, dass die Summe der Gesunden, Infizierten und Genesenen (inkl. Toten) konstant und positiv bleibt. Geburten, Einwanderung u.ä. ist nicht berücksichtigt. Und das liefert keine Parabel oder Gerade, weil dort kein Zusammenhang zwischen verschiedenen Gruppen modelliert ist. Die Parabel geht auch deshalb nicht, weil es ja keine  negativen Infizierten geben kann. Und wie soll ein Ende der Epedemie prognostiziert werden ohne diese Zusammenhänge?

Ulli,
ist mir alles zu aufwändig. Dies würde einen
wesentlich höheren Arbeitsaufwand bzw
Einarbeitung in die Thematik erfordern.

Es geht nur darum in etwa den Hochpunkt
der Epidemie zu prognoszitieren

Tage, Wochen,Monate ? Es gibt die unter-
schiedlichsten Prophezeiungen

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community