Aufgabe:
Der vorliegende fiktive Datensatz enthält Daten von 500 produzierten Tonnen Schokolade eines Schokoladenproduzenten. In der Produktion wird von einer Sorte (unterschiedlicher Kakaogehalt) jeweils eine Tonne produziert und dann die Sorte gewechselt. Die Variablen im Datensatz sind: die Produktionskosten pro Tonne [in Tausend Euro] (kosten), der Kakaogehalt der Schokolade [Angabe in Prozent] (kakao) und der Produktionsstandort des Unternehmens (ort). Es gibt drei Produktionsstandorte, an denen Schokolade produziert wird. Eine lineare Regression mit den Produktionskosten je Tonne als abhängige Variable und dem Kakaogehalt sowie dem Produktionsstandort als unabhängige Variablen liefert den folgenden R-Output.
> model <- lm(kosten ~ kakao + ort, data = datensatz)
> summary(model)
Call:
lm(formula = kosten ~ kakao + ort, data = datensatz)
Residuals:
Min 1Q Median 3Q Max
-8.68297 -2.04961 0.00218 2.16693 11.38959
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.5631200 0.5077191 10.9571 < 2.2e-16 ***
kakao 0.1425800 0.0077695 18.3510 < 2.2e-16 ***
ortort1 -2.0841500 0.3064805 -6.8003 3.012e-11 ***
ortort2 -1.8940600 0.3793474 -4.9930 8.249e-07 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.9859 on 496 degrees of freedom
Multiple R-squared: 0.44962, Adjusted R-squared: 0.4463
F-statistic: 135.07 on 3 and 496 DF, p-value: < 2.22e-16
Schätzen Sie die durchschnittlichen Produktionskosten in Tausend Euro des Unternehmens an Standort 3 für eine Schokolade mit einem Kakaogehalt von 54%.
Problem/Ansatz:
Komme hier nicht weiter