Information zur Simulation der Coronavirus Covid-19 Pandemie
- Motivation
- Wie kann die Simulation dabei helfen?
- Definitionen
- Was ist das Problem?
- Daten
- Simulationsablauf und Bedienung
- Beispiele
- Modell
- Modell der Datenerhebung
Motivation
Diese interaktive Simulation und Datenvisualisierung soll folgendes verdeutlichen:
- Wie verzögert sich Maßnahmen zur Isolation oder auch
anders verursachte Änderungen der Infektionsrate auf die
Infektionszahlen auswirken,
- wie sehr sich die reale Situation von der beobachteten
unterscheidet, vor allem, wenn wenig und verzögert getestet
wird,
- wie schwierig die
Reproduktionszahl R und ihr
zeitlicher Verlauf zu schätzen ist: Je nach den Werten der
anderen Parameter wie Periode der
Ansteckbarkeit, mittlerer Testzeitpunkt sowie Testhäufigkeit.
- Wie sensitiv Prognosen von den gemachten Annahmen abhängen.
Update Oktober 2020: Obiger Text wurde im April 2020
formuliert. Nun dringen die dort gemachten Bemerkungen langsam ins
allgemeine Bewusstsein, insbesondere die Verzerrung der
wahrgenommenen Lage durch Erhöhung der
Testrate: Der vom RKI
berechnete R-Wert, der eigentlich ein intrinsischer Parameter der
Infektionsdynamik sein sollte, hängt von der Testrate und ihrer Veränderung
ab, was offensichtlich widersinnig ist.
Wie kann die Simulation dabei helfen?
Allen Covid-19-Modellen und Simulationen (und übrigens auch allen
Klimamodellen und deren Simulationen) ist
gemeinsam, dass sie keine Prognosen
ermöglichen. Sehr wohl möglich ist aber
eine Szenarienanalyse, also eine bedingte Projektion in die
Zukunft, etwa folgender Art:
"wenn zum Zeitpunkt T durch die Implementierung oder
Unterlassung von Maßnahmen oder durch das Wetter die
Reproduktionszahl R0 einen gewissen Wert
erreicht, die Durchseuchung X so und so ist, der Infektionszeitraum zwischen 3 und 7 Tagen nach der
Infektion liegt, dopplt so viel
getestet und wie bisher medizinisch behandelt wird
(gleiche infection fatality rate), dann wird es
in Woche A eine Zahl B an neuen
Positivtests sowie C reale Neuinfektionen geben sowie in Woche
D eine Zahl E an Covid-19-Toten." |
Um es (angeblich) mit Mark Twain zu sagen:
Prognosen sind schwierig,
vor allem, wenn sie die Zukunft
betreffen.
Dennoch kann die Simulation wichtige Hinweise geben, wie zu handeln
ist und vor allem welche
Untersuchungen wichtig wären: Wie hoch ist die Durchseuchung bzw die
Dunkelziffer?, wie hoch
sind die Testfehler der verschiedenen Tests?
Definitionen
Um die Simulation und die allgemeine Corona-Problematik zu verstehen,
ist es wichtig, Folgendes zu unterscheiden:
-
Reproduktionszahl R bzw. R0 : Wie viele Menschen ein
Infizierter im Mittel ansteckt. Manchmal wird noch zwischen dem
Modellparameter
R0 (Ansteckungszahl bei Durchseuchung Null) und dem
tatsächlichen, sich aus der Dynamik ergebenden R-Wert
mit Immunitätsgrad >0 unterschieden. In der Simulation sind immer
die R0-Werte angegeben. Diese sind immer höher
als die R-Werte mit Teilimmunität
- Durchseuchung X: Der
Anteil aller bisher Infizierten (nicht symptomatisch Erkrankten!) in
der Bevölkerung, unabhängig vom Ausgang (aktuell infiziert,
genesen oder gestorben)
- Immunitätsgrad I:
Wenn alle Infizierten immun werden und keine Impfung verfügbar
ist, ist I=X, bei Teilimmunität sinkt I, mit
Impfungen steigt er
- Infektionsrate x: Zahl
der Neuinfizierten in einem gewissen Zeitraum Δt. Bei
Ausschluss von
Doppelinfektionen gilt bei einer
Bevölkerungszahl n
x(t)=n [ X(t)-X(t-Δt) ]
Ist Δt gleich der Dauer einer aktiven Infektion (bis zur
Genesung oder Tod, etwa 3 Wochen) , stellt x die Zahl der aktiv
Infizierten dar und x/n die
sogenannte Prävalenz
- Testrate nt: Zahl der
Tests (egal ob positiv oder nicht) pro Zeitraum Δt (Tag oder Woche)
- Hellfeld H: Anteil der
Infizierten, die getestet werden Achtung: dies ist etwas
unsauber definiert, da es Testfehler gibt und H damit nicht
genau der erkannten Infizierten entspricht. Mit dem wie oben
definierten H werden aber die statistischen Formeln einfacher
und man kann jederzeit ins "wahre" Hellfeld umrechnen.
- Bevölkerungs-Positivanteil Xt: Der
Anteil aller bisher positiv Getesteten
in der Bevölkerung. Dieser ist nicht gleich X, denn
- nicht jeder Infizierte wird getestet (Dunkelfeld). Ferner sind die Tests
nicht zu 100% sensitiv (Fehler erster Art, false negatives),
- nicht jeder positiv Getestete ist infiziert, denn die Tests haben eine
nichtperfekte Spezifizität
(Fehler zweiter Art, false
positives)
- Positivrate xt:
Zahl der positiven Testergebnisse im Zeitraum Δt. Falls jeder
höchstens einmal getestet würde, gälte
xt(t)=n [Xt(t)-Xt(t-Δt)]
- Test-Positivanteil
pt=xt/nt:
Anteil der positiven Tests unter allen Tests im betreffenden Zeitraum
- Y, Yt und yt:
Anteilswert an Genesenen in der Bevölkerung sowie der Anteilswert
und die Rate an Genesenen, welche vorher positiv getestet
wurden. Dies ist tricky: Sind etwa symptomfrei positiv Getestete
zum Testzeitpunkt bereits genesen oder nicht? Oder sind sie es, wenn sie
nicht mehr ansteckend sind? Die entsprechenden
Daten sind deshalb in vielen Ländern
nicht konsistent/brauchbar und für uns zum
Verständnis auch nicht nötig
- Anteil der an Covid-19 gestorbenen
Personen in der Bevölkerung Z=Z_t sowie
zt(t)=n
[Zt(t)-Zt(t-Δt)]. Hier gehe ich
davon aus, dass jeder Covid-19-Todesfall früher oder später
getestet wurde, sodass dies unter allen realen Größen die einzige bekannte ist
- Case fatality rate (CFR) :
Anteil der positiv Getesteten, die schließlich ursächlich an
Covid-19 sterben.
Update 2020-09:
Die CFR liegt nun um oder unter 1%, anfangs war sie etwa 4-6%, siehe die
"Infektionsraten"-Ansicht der Visualisierung
- Infection fatality rate (IFR) :
Anteil der Infizierten, die schließlich ursächlich an
Covid-19 sterben. Wegen der unbekannten Dunkelziffer kann sie
nicht aus den allgemeinen Infektionszahlen, sondern nur durch
dezidierte Untersuchungen geschätzt werden. Die
simulierte IFR liegt ab Sommer in den meisten Ländern im Promillebereich
Was ist das Problem?
Mit wenig Ungenauigkeit bekannt sind die primär
veröffentlichten
Größen xt, yt, zt
sowie nt. Daraus können alle Größen mit
Subskript "t" sowie die CFR ohne große systematische Fehler
abgeleitet werden.
Allerdings will man zur Beurteilung des weiteren Infektionsverlauf und
davon abhängige politische Entscheidungen die realen
Größen wissen, also die ohne "t". Dummerweise
sind allein die Todesfälle Z bzw. z angenähert
bekannt. Für die wichtigsten vier Größen ist
abgesehen von R jedoch nicht einmal
die Größenordnung bekannt:
- Die Reproduktionszahl R0
bzw R=R0(1-I) gibt die aktuelle
Infektiosität bzw. Dynamik an (R ist nicht das Verhältnis zweier
Positivraten, wie aus den obigen Definitionen klar werden sollte!),
- die IFR gibt an, wie schlimm die Seuche für den Einzelnen ist,
- die Infektionsrate x multipliziert mit der IFR, wie schlimm sie gegenwärtig für die
Volkswirtschaft ist bzw. wie voll die Intensivstationen in etwa zwei
Wochen sind,
- die Durchseuchung X bzw. der Immunitätsgrad I,
wie weit sie fortgeschritten ist, d.h. wie die Lage für die
Volkswirtschaft in Zukunft sein wird.
Warum sind diese Größen trotz aller Tests unbekannt?
Um die IFR und x und damit die Durchseuchung X abzuschätzen,
benötigt man
den Hellfeldanteil H, also den
Anteil aller Infizierten, die auch getestet werden. Falls
zusätzlich die Tests perfekt sind,
könnte man zumindest etwas verzögert (s.u.) die realen
Größen (ohne Subskript 't') durch
x(t-τT) = xt(t)/H,
IFR(t-τT) =H CFR(t) usw.
schätzen und damit auch X und R
bzw R0. Leider sind weder die Tests perfekt noch
bekannt,
welcher Anteil der Infizierten getestet wird. In der Simulation mache
ich bezüglich der Tests folgende
Annahmen (Modell-Annahmen weiter unten):
-
Abhängigkeit des Hellfeldes von der Testrate:
Offensichtlich werden
umso mehr Infizierte erwischt, je mehr getestet wird. Aber dies geht
nicht linear mit der Testrate nt, da ein
Auswahleffekt vorliegt: Leute mit Symptomen werden wahrscheinlicher
getestet und Massentests an Symptomfreien kommen erst zum Schluss
dran. Ich nehme daher eine wurzelförmige Abhängigkeit an, bei
der alle Infizierten getestet werden (H=1), wenn die Testrate
nt gleich
ntmax=n0/Woche
ist, also alle in jeder Woche
(in etwa der Ansteckungszeitraum) einmal durchgetestet werden. In
der Simulation kann man die Abhängigkeit auch abstellen und das
Hellfeld direkt durch einnen Schieberegler einstellen.
- Testfehler: Ich nehme eine
- Sensitivitätsfehler α=2% an,
d.h. aktiv Infizierte werden fälschlicherweise negativ getestet,
sowie (wichtiger!) eine
- Spezifizitätsfehler β=0.3% an. Dies gibt
die False-Positive-Rate an, also die
Wahrscheinlichkeit dafür, dass gesunde Personen
(ggf. auch bei einem Nachtest) positiv getestet werden.
Fatal daran ist, dass man bei einer geringen
Prävalenz x/n überproportional
viele false Positives
erhält, weit mehr als der Anteil β. Bei Zufalls-Massentests erhält man man sogar mehr
false Positives als echte Infizierte, wann immer der
β-Fehler größer als die Prävalenz ist!
- Todesfälle durch (nicht mit!) Covid 19:
Hier nehme ich im Gegensatz zum Infiziertenstatus ein 100%-iges
Hellfeld an.
Daten
Es werden zwei allgemein zugängliche Datenquellen verwendet:
-
Täglich
aktualisierte, kompakte Zeitreihen,
synthetisiert von Rodrigo Pombo,
die direkt live geladen werden,
- weitergehende, ebenfalls täglich
aktualisierte Daten des
Our World in Data (OWiD) Projekts,
welche auch Informationen über die Testhäufigkeiten
enthalten. Diese Datenquelle ist aber zu groß, um sie life zu
laden. Sie wird deshalb serverseitig extrahiert und Redundanzen
eliminiert, um nur die
relevanten Informationen laden zu müssen.
Simulationsablauf und Bedienung
Gezeigt wird anfänglich die Situation in Deutschland bis zur
Gegenwart (mit kann man dann weiter
simulieren), und zwar
die Ansicht "Simulation+Daten": tägliche Simulationsergebnisse im
Vergleich zu den
hinterlegte Daten.
Es sind aber
auch noch
-
zwölf andere Länder und
- fünf weitere Ansichten (Simulation der kumulierten
Größen, logarithmische
Darstellung, Fallzahlen-Ansicht mit simulierten "wahren" Infektionszahlen, Test-Ansicht und
Infektionsraten) einstellbar.
Bei Aufruf der Seite wird die Simulation zunächst
bezüglich der wöchentlichen Reproduktionszahl anhand der
kumulierten Positivenzahlen Xt kalibriert
("gefittet") und
anschließend durch Variation der simulierten
IFR in fünf Perioden an die kumulierten Todesfallzahlen gefittet,
indem die Fehlerquadrate minimiert
werden. Die Simulation startet am 8. März, also etwa eine Woche vor den
ersten
Lockdown-Maßnahmen.
- Die Regler für die Reproduktionsrate R0 und des
Hellfeldes "zappeln" nach Maßgabe des Fit-Ergebnisses bzw. des
obigen Quadratwurzel-Modells hin und
her. Die gefittete IFR ist in
der Infektionsratenansicht einsehbar.
- Die jeweils geschätzte Reproduktionsrate
wird als grauer Text auch in die
Simulation eingezeichnet.
- Sobald man diesen oder den Hellfeldregler selbst bedient, wird
die Schätzung
beendet und die angezeigten R0-Werte entsprechen
der eigenen
Aktion. Natürlich werden dann i.A. die simulierte und real gemachte
Positivzahlen nicht mehr übereinstimmen. Dies gilt natürlich
auch, wenn man andere Regler bedient: In beiden Fällen kann man dann
neu kalibrieren, um die für die neuen Einstellungen am besten
passenden R0- und IFR-Werte zu erhalten.
Für das
Stoppen und Wiederholen der Simulation gibt es drei Eskalationsstufen:
- Mit
kann man die Simulation für eine Szenarienanalyse vom
aktuellen Zeitpunkt aus fortführen und mit
wieder stoppen.
- Mit
startet man die Simulation vom Anfang an mit den gerade eingestellten
Parametern. Hat man nach dem letzten Reset oder der letzten Länderwahl
den R0-Regler nicht geändert, wird die
Parameterschätzung wieder aktiviert und angezeigt.
- Mit
führt man den "Reset auf die Werkseinstellungen"
durch. Nur das eingestellte Land bleibt unverändert.
Die weiteren Bedienelemente der Simulation sind die folgenden:
- Länderwahl 12 weitere
interessante Länder sind wählbar
- Wahl der Ansicht
- Simulation+Daten Standardeinstellung: Hier sieht man den
Übereinstimmungsgrad der Simulation der täglichen
Positivzahlen und Todesfälle mit den Bobachtungsdaten. Als
einziger "wahrer" Infektionswert wird die simulierte
Durchseuchungsrate als Text angezeigt
- Simulation (kum)
Übereinstimmungsgrad der Simulation der kumulierten
Positivzahlen und Todesfälle mit den Bobachtungsdaten. Man beachte
die unterschiedliche Skalierung durch die Multiplikatore 100
(Todesfälle) und 1000 (Testpositive). Für manche Länder wird
auch die Zahl der Genesenen gezeigt, diese Größe ist aber, wie
bereits erwähnt, häufig nicht gut definiert und inkonsistent.
- Logarithmische Simulationsansicht.
Hier sieht man zusätzlich die simulierten nichtbeobachtbaren Größen "Zahl der
aktiv Infizierten" und "Durchseuchung".
- Daten: Faelle Hier sind im Gegensatz
zu den ersten beiden Ansichten die täglichen anstelle der
kumulierten Daten gezeigt: Beobachtete Zahl der
Positiv-Fälle" und Zahl der Todesfälle" im Vergleich zur
Simulation. Man beachte,
dass die simulierten Neuinfektionen um eine Größenordnung
größer sind als die positiv getesteten und zeitlich
vorauseilen, vor allem wenn man den Regler "Test nach ..." auf hohe
Werte stellt.
- Daten: Tests Hier liegt der Fokus
auf die Tests und deren Unzulänglichkeiten: Die realen
Infektionsfälle sind bei den Standardparametern um eine
Größenordnung größer als die beobachteten und eilen letzteren
voraus. Man sieht auch, dass aufgrund der steigenden Testrate (blaue
Punkte) die Zahl der Positivfälle im Vergleich zu den
Realfällen zunimmt, zumindest, wenn man
das Quadratwurzelmodell nicht ausschaltet
(Ignoriere
Testhäufigkeit). Schließlich wird die Zahl der simulierten false
Positives bei einem Beta-Fehler β=0.3% gezeigt. Man beachte die Multiplikatoren 1,10 und
100, damit alle Daten auf eine Grafik passen!
- Infektionsraten-AnsichtNeben den allein aus den Daten
extrahierbaren relativen Größen "Positivanteil" und case fatality
rate(CFR) wird hier die gefittete infection fatality
rate(IFR) geplottet.
- Kalibriere neu! Dreht man an den Reglern
oder wählt ein konstantes Hellfeld,
ist die Simulation bezüglich der Reproduktionsraten nicht mehr an
die Positivenzahl gefittet, da das Modell auch andere Faktoren
hat. Hier kann man mit den aktuellen Einstellungen R0 neu
fitten.
- Berücksichtige
Testhäufigkeit Schaltet zwischen dem obigen
Quadratwurzelmodell für das Hellfeld und einem konstanten durch den
Schieberegler einstellbaren Wert hin und her.
- Die Schieberegler für die
wichtigsten Modellparameter lassen sich bei gestoppter und auch bei
laufender Simulation bedienen.
- Der erste Regler für die
Reproduktionszahl R0 ohne jede
Herdenimmunität ist der
wichtigste. Sobald man ihn bedient, ist die anfängliche
Schätzung nicht mehr aktiv.
- Die Regler Ansteckungsstart und
Ansteckungsende machen den
Ansteckungszeitraum, bezogen auf den eigenen Infektionszeitpunkt einstellbar
- Im Gegensatz dazu lassen sich mit den Reglern
Test nach ...
und Hellfeld zusammen mit den
Button Berücksichtige
Testhäufigkeit Annahmen über die Tests im
Sinne einer Szenarienanalyse ändern.
Beispiele
- Szenario "Unverändert": Drücken Sie nach dem Stopp der
Simulation auf
und stoppen Sie die Simulation nach einigen Monaten bzw. wenn im Falle
von R0 > 1 die
Infektionsspitze erreicht ist.
Schlussfolgerung: Sie sehen,
dass fast überall höhere Fallzahlen prognostiziert werden (in
Deutschland sogar die berühmten knapp 20 000 zu Weihnachten), in kaum einen Land aber die Todesfallzahlen vom
Frühjahr erreicht werden. Ferner ist die Pandemie im Frühjahr
fast überall vorbei, in einigen Ländern wie Schweden schon
eher (beachten Sie
aber Mark Twain).
- Szenario "Sensitivitätsanalyse
bezüglich R0": Lassen Sie die Simulation
mit neu laufen bis zur
Gegenwart, verändern Sie nun den R-Wert um einen kleinen
Betrag, z.B. von 1.15 auf 1.05 und lasen Sie die Simulation mit weiterlaufen. Sie
werden ganz andere Ergebnisse erhalten, z.B. in Deutschland eine
Abnahme der Neuinfektionen und kaum noch
Todesfälle (auch wenn R0 > 1 ist, können die tägliche
Fallzahlen nach unten gehen, wenn eine hinreichende Durchseuchung
I erreicht ist so dass R = R0 (1-I) <
1 ).
Schlussfolgerung: Einzig mit dem
geschätzten R-Wert weiterzusimulieren ist komplett unseriös, da
Unsicherheiten in R von 0.1 zu um den Faktor 10 unterschiedlichen
Peaks führen können. Eine Aussage wie "zu Weihnachten wird es 19
600 Fälle pro Tag geben" lässt auf mangelndes Modellversändnis
(oder eine Agenda) schließen!
- Szenario "Lockdown": Am besten die Ansicht Simulation+Daten
oder Daten: Tests
wählen und
mit Kalibriere neu! die R-Werte neu bis
zur Gegenwart fitten. Dann, als Folge der Lockdown-Maßnahme, den
R-Wert deutlich unter 1, z.B. 0.8, schieben und
weitersimulieren. Während die tatsächlichen
Nuinfektionen sofort sinken (Test-Ansicht), folgen
die gemessenen positiven Fallzahlen zunächst eine Woche den
bisherigen Trend, ehe auch sie sinken. In der
kumulierten Ansicht Simulation (kum), in
der nur simulierte Messungen gezeigt werden, erkennt man eine Woche
lang überhaupt keine Wirkung. Wie die Situation wirklich
aussieht, erkennt man in der Simulation
(log) Ansicht: Insbesondere fällt die tatsächliche
Neuinfektionsrate geradlinig nach unten, was einem exponentiellen
Abfall enstpricht. Schlussfolgerung:
die Folgen von Eingriffen in das Infektionsgeschehen kann man nur
verzögert beobachten/messen
- Szenario "Sensitivitätsanalyse: Änderung des Infektionszeitraums oder der Testverzögerung": Der mit den
zweiten und dritten Regler einstellbare Infektionszeitraum ist neben
dem R-Wert der wichtigste Parameter der Infektionsdynamik. Wie
beeinflusst er die R-Schätzung? Stellen Sie zunächst mit Reset
,
den Ausgangszustand her und merken sich die geschätzten R-Werte. Ändern Sie nun den Zeitraum,
z.B. Ansteckungsstart 6 Tage statt 1 Tag nach der eigenen
Infektion und drücken Sie
Kalibriere neu!: Je kleiner der
mittlere Ansteckungstag ist, desto näher sind die R-Schätzungen
um 1, die Ereignisse "R-Werte oberhalb 1" bzw "unterhalb" sind aber
robust. Auch die Prognose "Unverändert" (einfach
weitersimulieren in der Ansicht "Tests") ändert sich, oft aber
erstaunlich wenig. Hier sieht man deutlich,
dass die aus den
Daten geschätzten R-Werte weit von den realen Werten der
Infektionsdynamik entfernt sein können und zwar sowohl
von R0 (mittlere Zahl der Ansteckungen pro Person ohne
Immunität) als auch von R (mit Teilimmunität)
- Szenario "Änderung der Testrate": Stellen Sie zunächst mit Reset
,
den Ausgangszustand her, verschieben Sie den
Hellfeld-Regler auf das Maximum und
kalibrieren Sie neu. In der
Ansicht Simulation+Daten sehen Sie
nichts, da dort nur (reale oder simulierte) Beobachtungen zu
sehen sind und die Simulationsparameter, inbesondere die R-Werte, an
die neue angenommene Situation angepasst wurden. Simulieren Sie
mit weiter, sehen Sie
einen viel drastischeren Verlauf als vorher. Wiederholen Sie das
Ganze mit der minimalen Hellfeld-Einstellung und Sie sehen in der
Zukunftsprojektion ein
Ende der Epidemie in wenigen Wochen obwohl sich bis zur
Gegenwart nichts geändert hat! Warum?
Dazu sehen Sie in den anderen Ansichten nach, in der logarithmischen
sehen Sie beispielsweise eine im Fall eines geringeren Hellfeldes
höhere Durchseuchung und in den anderen Ansichten höhere
tägliche tatsächliche Infektionsraten. Klar: Um bei
einem geringeren Hellfeld auf die beobachteten Fallzahlen zu
kommen, müssen mehr infiziert werden!
Die Projektionen hängen also stark vom
angenommenen Hellfeld
ab!
- Szenario "dynmische Erhöhung der Testrate":
Dieses wichtige Szenario zeigt, wie man allein durch eine zeitlich
veränderliche Testrate zu
völlige falsche Schlussfolgerungen kommen kann! Stellen Sie das
Hellfeld auf mittlere Werte (durch Nutzung des Reglers wird die
automatische Testzahlkorrektur ausgeschaltet) und kalibrieren
Sie neu. Erhöhen oder erniedrigen Sie nun während der
Simulation in der Ansicht Simulation+Daten oder Simulation (kum) das Hellfeld und sehen
Sie, was passiert!
Allein durch erhöhtes Testen kann man bei
stabilen realen Infektionsgeschehen einen
Neuanstieg ("zweite Welle") vortäuschen, der einen
möglicherweise realen Anstieg kaschiert!
Modell
Simuliert wird ein makroskopisches
Standard-Infektionsausbreitungsmodell, was dem
SEIR-Modell
ähnlich ist, aber Latenzen wie zwischen
Ansteckung und Infektiosität explizit durch Delay-Terme statt durch
gewöhnliche Differentialgleichungen beschreibt:
- Jeder Infizierte steckt im Laufe seiner Krankheit
R(t)=R0(t) (1-I)
andere Personen an. Hierbei bedeuten R0(t)
den durch verschiedene Maßnahmen und/oder durch
das Wetter zeitlich veränderlichen Reproduktionszahl ohne Immunität und I
den Immunitätsanteil.
- Der Immunitätsanteil
I=X
wird gleich der
Durchseuchungsrate gesetzt, also gleich der Summe des
Anteils der gerade (auch symptomfrei) erkrankten Personen, des Anteils Y aller bereits
wieder gesundeten Personen und des Anteils Z der gestorbenen
Personen. Es wird also davon ausgegangen, dass jeder nur einmal
erkranken kann und dass keine Impfungen verfügbar sind,
die I weiter erhöhen würden. Alle Anteilswerte beziehen sich immer auf die Bevölkerungszahl am
Anfang der Pandemie. Die Summe sonstiger Zuwächse oder Abnahmen
der Bevölkerung wird gleich null gesetzt.
- Die Ansteckung geschieht gleichverteilt innerhalb einer
mit Schiebereglern einstellbaren Spanne des
Infektionsalters τ. Der Einfachheit halber ist die
Ansteckungsverteilung unabhängig vom Alter und von der Existenz
oder Schwere der Symptome.
- Die Infizierten sterben im Laufe der Krankheit mit der
wahren Sterblichkeit IFR, und zwar
gleichverteilt nach
τD±2 Tagen
- Mit der Komplementärwahrscheinlichkeit (1-IFR) erholen sich die Infizierten, und zwar
gleichverteilt
τRec±2 Tage nach der Infektion.
Modell der Datenerhebung
Dies betrachte ich als Unique Selling
Point meines Simulators
- Getestet wird ein durch das Hellfeld H
charakterisierter Anteil an
(auch symptomfrei) real erkrankten Personen. Dazu gibt es im
Simulator zwei Möglichkeiten der Modellierung:
- datengetrieben durch die Anzahl nt an täglichen
Tests durch
H=sqrt(7nt /n0)
Hier steckt die Annahme dahinter, dass bei einer wöchentlichen
Volltestung aller n0 Personen das Hellfeld 100% ist
und bei geringerer Testung zunächst die Verdachtsfälle getestet
werden
- direkt durch den Schieberegler. Dann ergibt sich die Zahl der
Tests implizit durch Umkehrung der obige Formel
Der Test hat eine Sensitivität
von 1-α mit
α=2% und eine Spezifizität von
1-β mit der false
Positive Rates (β-Fehler) β=0.3%
Dadurch ergibt sich nach dem Satz von Bayes eine Wahrscheinlichkeit
dafür, dass ein Test positiv ausfällt, von
P(positiv) = p(1-α) + (1-p) β,
p = H x / nt,
wobei p der wahre Anteil an Infizierten unter den Testpersonen
ist und x die wahre Zahl der testrelevanten
Infizierten. Die
Positivenzahl xt=ntP(positiv) ist dann
letztendlich die zu fittende Größe.
Getestet wird τT±2 Tage nach der Infektion.
Wird die Testrate während der Simulation verändert,
bezieht sich dies nur auf neue Tests. Wird beispielsweise zum
Zeitpunkt t das Hellfeld von 10% auf 20% erhöht, ist
dies nur für die danach getesteten relevant.
Bei den Toten ist die Dunkelziffer gleich null, d.h. jeder an Covid19
Gestorbene wird entweder während der Krankheit oder danach durch Autopsie
getestet.
Impressum