Ein Gastbeitrag von Anna Lena Fehlhaber, KI-AI-Anwenderin und Entwicklerin der Leibniz Universität Hannover für die 256. Ausgabe von #7t7n (Archiv).
Corona-Krise: RKI-App gestartet und jetzt? Die sogenannte Corona-Datenspende-App des Robert-Koch-Instituts (RKI) ist seit einem Monat (7. April 2020) verfügbar. Die Daten werden von einer Cloud, beispielsweise eines Fitness-Trackers, an einen zentralen Server weitergeleitet und dort gesammelt. Die Frage, die sich hierbei stellt, ist, wie danach mit den Daten verfahren wird und welchen konkreten Beitrag sie leisten können, um die Infektion mit SARS-CoV-2 besser zu verstehen. Das RKI selbst gibt an, die Daten zeitnah auszuwerten und sich dadurch einen Überblick über das Infektionsgeschehen verschaffen zu können.
Wie präzise sind die erfassten Daten? Lässt sich die Ausbreitung eventuell sogar durch maschinell lernende Algorithmen verstehen oder modellieren?
Bevor die Frage gestellt wird, ob die so gewonnenen Daten durch schwache KIs modelliert werden können, ist es relevant zu klären, wie die Daten derzeit erfasst werden. Um Datenschutz zu gewährleisten werden die Daten bislang so verändert, dass sie keine direkten Rückschlüsse auf Einzelpersonen zulassen. Gleichzeitig können sie aber nicht vollständig anonymisiert werden, weil dann keine Aussagekraft der Daten mehr gewährleistet ist. Dadurch wird es gleichzeitig aber auch Menschen ermöglicht, falsche Daten zu übermitteln, ohne dass diese aussortiert oder nachvollzogen werden könnten. Auf die vielfältigen Manipulationsmöglichkeiten hat der Chaos Computer Club bereits hingewiesen. Nachbesserungen für diese essenzielle Funktion der App gestalten sich jedoch als sehr diffizil. Dadurch ist das so generierte Datenset prinzipiell in seiner Validität als stark eingeschränkt einzuschätzen.
Güte der Daten
Mit der Güte der Daten fällt und steigt auch die Güte eines Modells. Abgesehen davon, dass bislang nicht einmal genug Plattformen und Betriebssysteme unterstützt werden, um ausreichend Daten zu generieren – selbst wenn jeder der ein unterstütztes Smartphone besitzt die App installieren würde – ist die Aussagekraft der Daten mehr als fraglich.
Spill-over
Modelle und Simulationen für (infektiöse) Ausbreitungen und geographische Spill-over Effekte sind vorhanden und können, ob mit oder ohne den Einsatz einer schwachen KI, gute Ergebnisse erzielen. Wie immer bei der Modellierung komplexer Zusammenhänge können kleine Änderungen zu massiven Veränderungen des Gesamtsystems führen – hier wäre der häufig rezitierte Flügelschlag eines Schmetterlings und die Wettervorhersage zu nennen (wobei der ‚wahre‘ Effekt immer noch heftig diskutiert wird… Es ist leider schwierig, dieses Experiment empirisch durchzuführen).
Fazit
Das Hauptproblem bei der RKI Corona-App liegt darin, dass die erhobenen Daten hinsichtlich ihrer Qualität und Validität kaum zu beurteilen sind und ein mit ihnen generiertes Modell schlichtweg – zum jetzigen Zeitpunkt zumindest – keine zuverlässigen Aussagen treffen kann.
#7t7n (Archiv) bleibt am Thema dran …
Ich habe gerade diesen Beitrag gelesen, etwas spät. Gibt es in der Zwischenzeit neue Erkenntnisse?
Im Nachgang kann man leider diese App getrost als gescheitert betrachten.