Ein Video des Mathematikstudenten Patrick Schönherr wird viral verteilt. Er kritisiert die Berechnung der Inzidenzwerte und schlägt eine alternative Berechnungsmethode vor. Höhepunkt des Videos ist eine Beispielberechnung, die im folgenden Bild dargestellt wird. Demnach rechnet Schönherr für seinen Landkreis aus 83 positiven Tests tatsächlich nur 19 „anrechenbare“ aus und „korrigiert“ die „falsche“ offizielle Inzidenz von 78,3 auf 18.
Das Video wird vor allem von Ignoranten, Leugnern und in harten Verschwörungsforen gefeiert. Es ist mir selbst in zahlreichen Dialogen mit der vollkommen unkritischen Bewertung, die Inzidenzen seien falsch berechnet und viel zu hoch, präsentiert worden. Das sei demnach mathematisch klar. Ein Rechenfehler also.
Das Video hat es nicht zuletzt aufgrund dieser Verbreitungswege, die sich in den sozialen Medien schnell multiplizieren, sobald die Algorithmen einen Inhalt alleine aufgrund der Intensität seiner Verbreitung relevant finden, sogar in einige Medien und auf den Twitter-Account von Viola Priesemann geschafft. Diese Aufmerksamkeit hat das Video gar nicht verdient, aber so ist es mit den modernen Medien nun mal, weshalb es nun auch diesen Blog hier erreicht. Correctiv hat das Video untersucht und umfassend eingeordnet.
Mehr ist dazu eigentlich nicht zu sagen. Warum sich Menschen für eine Berechnung begeistern, die 83 Infizierte auf 19 herunter rechnet, ohne das dazu erforderliche Schwurbeltheorem von falschen PCR-Tests zu bemühen, ist vollkommen schleierhaft. Der Autor des Videos distanziert sich zwar von den meisten Verbreitungswegen, was man ihm zunächst auch abnehmen darf. Trotzdem muss die Sache etwas härter kritisiert werden, als Correctiv es tut, denn der junge Mann studiert laut seiner Facebook-Seite auf das Lehramt und es bleibt nur zu hoffen, dass er noch etwas zulegt, bevor er das ausüben darf.
Zunächst ist festzuhalten, dass sein Vortrag mit Mathematik kaum etwas zu tun hat. Es geht auch nicht darum, ob die offiziellen Inzidenzen richtig „gerechnet“ werden oder ob seine „Rechnung“ korrekt sei. Tatsächlich, das räumt er selbst ein, spricht er nur von banaler Dreisatzrechnung und die ist sowohl in der offiziellen Statistik als auch bei „seinem“ Rechenweg korrekt angewendet. Lassen wir also die Mathematik mal außen vor und wer das Video unter dem Stichwort „Rechenfehler“ verbreitet, hat genau gar nichts davon verstanden.
Tatsächlich setzt sich der Autor mit einem Problem auseinander, dass in der Statistik eine wesentlich komplexere Rolle als die Frage der Rechenmethoden spielt: Wie kommen die Daten zustande und was kann ich damit mit welcher mathematischen Methode berechnen?
Es ist schon nicht klar erkennbar, ob der Autor überhaupt versteht, mit welcher Frage er sich tatsächlich beschäftigt. Definitiv aber scheitert er daran vollständig. Was er hier vorschlägt, würde ich in einer Statistik-Klausur des ersten Semesters nicht mal mit einem „Ausreichend“ durchwinken – das wäre aufgrund eklatanter methodischer Mängel nicht bestanden, diese Leistung ist ungenügend.
Dass er mit seinen Dreisatzrechnungen alles richtig macht, ändert daran nichts. Der einzig relevante Punkt, den er aber als These ohne jeden Beleg nur mit einem angenommenen Beispiel darlegt, ist die Problematik, aufgrund der Testmethode die regionalen Inzidenzen zu vergleichen.
Bereits an der Stelle konstruiert er aber nur eine Beispielrechnung, die behauptet, es sei die Testmenge, die das Ergebnis verfälscht. Das ist aber bereits falsch, denn er unterstellt eine repräsentative Testmethode, die in der Tat mit unterschiedlichen Testmengen zu falschen Ergebnissen führen kann – aber bereits nicht muss. Was er da sagt, ist nicht mal die gerne behauptete These, die Testmenge führe automatisch zu steigenden Zahlen, denn er setzt sich mit der Steigerung der Zahlen methodisch gar nicht auseinander – obwohl er das immer wieder behauptet und im zweiten Teil des Videos auch Verlaufsdaten präsentiert, die jedoch mit seinen zuvor angestellten methodischen Aussagen überhaupt nichts zu tun haben. Tatsächlich behauptet er fortgesetzt, sich mit Problemen auseinanderzusetzen, die er tatsächlich gar nicht behandelt und zugleich kritisiert er Fehler an einer existierenden Testmethode, die so gar nicht stattfindet.
Hier wird also mehrfach das Thema komplett verfehlt. Daher ist auch die Kritik an der bestehenden Testmethode in dieser Form komplett falsch. Correctiv geht darüber eher gnädig hinweg, weil es natürlich sehr wohl berechtigte Kritik an der Testinfrastruktur gibt. Ich habe das hier oft genug erwähnt.
Tatsächlich ist die Testmethode in Deutschland eher so etwas wie „opportunistisch“. Es wurde und wird mit mehrfach wechselnder „Strategie“ der Versuch unternommen, durch die Tests die Infektionswege zu finden und einzudämmen. Das ist insofern zunächst mal nicht zu kritisieren. Wenn man also den Anspruch hat, alle tatsächlich Infizierten zu entdecken, kann man die auch so zählen, wie es gemacht wird. Dann wirken auch die Testmengen nicht verfälschend, sondern die Dunkelziffer reduzierend. Es gilt also: Je mehr getestet wird, desto genauer wird das Ergebnis – und nicht umgekehrt. Es ist richtig, dass die Steigerung der Testmenge – vorübergehend! – schnell steigende Infektionszahlen erzeugen kann. Tatsächlich ist das aber kein Fehlsignal, sondern genau das Gegenteil: Der Fehler wird durch den Rückgang der Dunkelziffer verkleinert.
Problematisch wird das aber, wenn das exponentielle Wachstum der Pandemie den Anspruch, alle Infektionen aufzudecken, unterläuft und wenn dadurch die Auswahl der Tests geändert werden muss. Dann nimmt die Vergleichbarkeit der Zahlen in der Tat ab, denn die Dunkelziffer weitet sich nicht nur aus, sie entwickelt sich regional zudem sehr unterschiedlich. Das ist aber genau nicht die Analyse dieses Videos, das wie gesagt von einer falsch durchgeführten Repräsentativuntersuchung ausgeht, die es gar nicht gibt.
Tatsächlich haben wir in den exponentiellen Wachstumsphasen der ersten und der zweiten Welle gesehen, dass die Infektionszahlen um ein Vielfaches schneller gewachsen sind als die Testmenge. Dazu hatte ich in den entsprechenden Phasen zwei Mal berichtet, das Thema sollte eigentlich mal enden, es ist ein alter Zopf: „Die Wodarg-Interpolation“ und „Die Testmenge ist nicht die Erklärung für exponentiell steigende Zahlen“ beschreiben den tatsächlichen Effekt in der Wachstumsphase: Dann kommt die Steigerung der Testmenge nämlich hinter der Entwicklung gar nicht her, das Wachstum der Epidemie wird also unter- statt überschätzt. Das ist auch keine Überraschung, denn ein biologischer Prozess, der sich in der Spitze alle zwei Tage verdoppelt, kann mit einer so rasch niemals skalierbaren Testinfrastruktur nicht mehr abgebildet werden.
Tatsächlich können steigende Testmengen also zwar theoretisch zu vorübergehend steigenden Zahlen führen, aber das ist bei uns sogar niemals passiert. Im Gegenteil ist in diesen Phasen die Pandemie entglitten. Umgekehrt war es übrigens im letzten Sommer, als bei vergleichsweise geringer Dynamik insbesondere bei den Urlaubsrückkehrern vermehrt getestet wurde. Da hatten wir mehrfach sprunghaft steigende Testmengen bei einem eher moderaten Anstieg der Zahlen. Auch das war eine Datenlage, die deutlich macht, dass die Testmenge bei der Methodik qualifizierter und eben nicht repräsentativer Untersuchungen nur eines bedeutet: Mehr Präzision!
Schwierig wird es aber, wenn die qualifizierte Untersuchung durch die Dynamik der Pandemie ausgehebelt wird und die Dunkelziffern steigen, zudem regional unterschiedlich. Es ist vollkommen richtig, in diesem Zusammenhang die Inzidenzen anzuzweifeln und auch deren regionale Vergleichbarkeit zu kritisieren. Die Ursache ist dabei aber stets eine zu geringe Testmenge, das hat der Autor in diesem Video vollkommen falsch dargestellt und nur nebenbei: Diese „Methode“ würde bei Regionen mit unterdurchschnittlich wenigen Tests die Zahlen deutlich steigern. So mancher Schwurbler sollte den Dreisatz besser mal auf die eigene Region anwenden, bevor er von „zu hohen“ Zahlen spricht. Insbesondere für die Großstädte und bevölkerungsreichen Regionen hätte diese Berechnung eine um Faktor fünf höhere Inzidenz zur Folge.
Methodisch/inhaltlich legt der Autor nämlich nur eine Umverteilung der lokal gemessenen Inzidenzen anhand der bundesweiten Testquote vor. Bereits so auf einen Satz fokussiert, sollte jeder erkennen, dass diese „Umrechnung“ natürlich rein willkürlich ist, denn sie erhebt den bundesweiten Testquotendurchschnitt quasi zum Goldstandard für die Korrektheit – ohne dazu auch nur einen einzigen Satz als Begründung zu wählen. Ferner sollte jedem klar werden, dass damit nur eine Umverteilung von angeblich zu hoch ausgewiesenen versus zu niedrig ausgewiesenen statt findet. Tatsächlich dürfte in der Tendenz hingegen genau eine andere Wahrheit dahinter stecken: In den Gebieten mit hohen Testquoten sind eher geringe Dunkelziffern zu erwarten und in Regionen mit geringen Testquoten sind die Inzidenzen vermutlich zu gering. Wenn man also so eine „Holzmethode“ per Dreisatz machen möchte, würde man eher die Gebiete mit auffällig geringen Testquoten hoch rechnen und die mit den besseren belassen.
Aber das ist natürlich alles Unfug, eine konstruktive Kritik an der Testmenge scheitert in dieser Form komplett, denn gänzlich anders als in der Beispielrechnung dargestellt, dürfte die eher hohe Quote von Tests in dem angesprochenen Landkreis dafür sprechen, dass die 83 Infizierten der Wahrheit viel Näher kommen, als die Daten aus anderen Regionen, die mit einer um ein Fünftel geringeren Testmenge erhoben werden und eine Hochrechnung nur mit der Testquote entbehrt schlicht in jeder Richtung jeglicher Grundlage. Die Quote ist ein Indikator für die Qualität der Messung, sie ist kein präziser Faktor, mit dem man qualifizierte Umrechnungen machen kann. Das ist einfach nur unbegründeter Unfug, der im mathematischen Effekt tatsächlich nachgewiesene Infektionen in Regionen mit überdurchschnittlicher Testquote rechnerisch in die Regionen mit weniger Tests verlagert. Was soll der Quatsch?
Nun ist das Problem der Vergleichbarkeit der Inzidenzen sehr wohl anzusprechen, denn Art und Umfang der Gegenmaßnahmen werden auf deren Basis definiert. Auch hier sollte man aber sauber trennen, was man tatsächlich sagt: Wenn ab einer Inzidenz von X Schließungen verhängt werden, sollte das nach dem Gleichheitsgrundsatz überall auch gleich gemessen werden. Der Autor des Videos führt mit seinem Beispiel der hohen Testquote nämlich keineswegs an, dass man in Berchtesgaden auf Basis zu hoher Werte handelt, sondern im Gegenteil legen seine Daten nahe, dass im Bundesdurchschnitt vermutlich eher zu geringe Inzidenzen ausgewiesen werden. Das liegt nämlich nah, wenn man die Testmethodik denn richtig versteht.
Neu ist das Thema übrigens nicht: Wissenschaftler weisen seit Beginn der Pandemie auf das Thema hin, ich habe es hier sehr oft getan und auch in dem Beitrag von Correctiv ist es erwähnt: Wenn man Inzidenzen heranziehen möchte und diese vergleichbar sein sollen, wäre es besser, regelmäßig repräsentative Untersuchungen bundesweit vorzunehmen. Also eine systematische Stichprobenanalyse zu machen, die der Autor ohne es zu überblicken tatsächlich voraussetzt und auch behandelt.
Das wäre jedoch eine komplexe Aufgabe, denn anders als beispielsweise bei der Wahlforschung ist es alles andere als einfach, eine epidemiologisch valide Stichprobe zu definieren. Dazu gibt es ganze Lehrbücher und dem jungen Studenten wäre hiermit das Studium dieser Werke zu empfehlen. So simpel, wie er sich das vorstellt, ist es nicht machbar. Zudem muss ihm klar sein: Es kann definitiv keine Stichprobenanalyse geben, bei der als Ergebnis ein geringerer Wert herauskommt als der in den Stichproben tatsächlich gefundene. Dieses „Ergebnis“ entlarvt sich von selbst.
Damit sind wir erneut an dem grundsätzlichen Punkt kritischen Denkens angekommen: Wie kann man als Studierender einer Wissenschaft eine Berechnung vorlegen, die tatsächlich nachgewiesene 83 Funde auf 18 herunter rechnet und auch noch behaupten, das sei eine sinnvolle Methodik?
Abschließend die Bemerkung, dass es in der Tat falsch ist, überhaupt auf die Inzidenzen als statischen Wert zu schauen. Mir gelingen hier seit Beginn der Pandemie recht gute Prognosen, weil ich ganz alleine auf das Wachstum der Daten achte. Es handelt sich also um Trendanalysen sowie Betrachtungen der inneren Strukturen der Daten (Positivquoten, CFR, Hospitalisierungen, Sterbefälle etc.). Für solche Struktur- und Trendanalysen gilt: Je mehr Daten (also auch Tests) es gibt und je stabilere Veränderungsmuster die ausbilden, desto genauer kann man daraus etwas ableiten. Das ist dann etwas mehr als Dreisatzrechnung, aber: Das funktioniert sehr gut, wir haben kein Problem, die Pandemie korrekt zu bewerten.