Aloha :)
Problem 1: Die Definition der 7-Tage-Inzidenz
Die 7-Tage-Inzidenz ist definiert als:$$I\coloneqq\frac{\text{Anzahl positiv getesteter Personen}}{100.000 \text{ Einwohner}\cdot7\text{ Tage}}$$
Sie wurde von der Politik so festgelegt, weil die Gesundheitsämter bei der Nachverfolgung nicht überlastet werden sollten. Eine Stadt mit 200.000 Einwohner hat mehr Mitarbeiter in ihrem Gesundheitsamt als eine Stadt mit 100.000 Einwohner. Daher war die Definition sinnvoll.
Als statistische Kenngröße hat die 7-Tage-Inzidenz so gut wie keine Aussagekraft, weil sie direkt proportional zur Anzahl der Tests ist. Wenn bei gleicher Erkrankungsrate der Bevölkerung doppelt so viel getestet wird, verdoppelt sich die Inzidenz. Als statistisch verwertbare Größe müsste sie wie folgt definiert sein:
$$I\coloneqq\frac{\text{Anzahl positiv getesteter Personen}}{100.000 \text{ getestete Personen}\cdot7\text{ Tage}}\quad\text{(statistisch sinnvolle Definition)}$$
Bei der Aufgabenstellung tritt also das Problem auf, dass du Statistik mit einer Messgröße machen sollst, die sehr stark von einer Rahmenbedingung abhängt (nämlich der Anzahl der Tests), die nicht erfasst wird.
Problem 2: Die Anzahl der Vervielfältigungs-Schritte beim PCR-Test
Der PCR-Test basiert auf einer Vervielfältigung von genetischem Material. Jedes Labor verwendet eine unterschiedliche Anzahl von Vervielfältigungsschritten, in der Regel zwischen 35 und 45 Schritte. Erst nach diesen Vervielfältigungsschritten erfolgt der Nachweis des genetischen Virus-Materials. Es kann und wird so sein, dass das Virusmaterial z.B. nach 38 Vervielfältigungsschritten noch nicht nachweisbar ist, nach 39 Schritten aber schon. Da die Zahl der Vervielfältigungsschritte nicht festgelegt ist, macht sozusagen jedes Labor, was es für richtig hält. Daher sind die PCR-Tests unterschiedlicher Labore ohne Kenntnis der Vervielfältigungsschritte nicht vergleichbar. Wir haben hier also eine zweite Rahmenbedingung, die nicht erfasst wird.
Problem 3: Falsch positive Ergebnisse
Der PCR-Test reagiert sehr empfindlich (weil das Material milliarden-fach vervielfältigt wird) auf genetisches Material. Schlägt er an, geht man davon aus, dass Gen-Abschnitte des Corona-Virus gefunden wurden. Es gibt aber viele Fehlerquellen. Es kann andere Viren geben, die ähnliches Gen-Material haben wir SARS-Cov2. Es kann zu Verunreinigungen der Probe kommen. Die Labor-Mitarbeiter können Fehler machen. So kann es passieren, dass der PCR-Test positiv ist, obwohl die Probe SARS-Cov2-frei war. Solche falsch positiven Ergebnisse schrauben die Inzidenz umso stärker nach oben, je mehr getestet wird.
Problem 4: Stichprobe
Du kannst den exakten Erwartungswert nicht bestimmen, weil dazu alle Menschen in Deutschland getestet werden müssten. Daher nimmt man als Näherung den Mittelwert der getesteten Personen. Dieser Mittelwert selbst ist daher gegenüber dem Erwartungswert mit einem Fehler behaftet. Dieser Fehler pflanzt sich in die Berechnung der Varianz bzw. in die Berechnung der Standardabweichung fort. Man kann diesen Fehler in der Varianz sehr gut korrigieren, indem man die sog. "empirische Stichproben-Varianz" bestimmt. Bei dieser wird mit dem Faktor \(\frac{1}{N-1}\) anstatt mit dem Faktor \(\frac{1}{N}\) multipliziert.
Es gibt noch viele weitere Probleme, aber die wichtigsten sollten genannt sein.