Diagnose per Stimme: KI für Husten und Schnupfen:
Mehr als 300 Millionen Audio-Schnipsel mit Stimmen lassen sich auf YouTube ganz problemlos finden. Und jedes hochgeladene Video darf vom Mutterkonzern Alphabet, also Google, genutzt und ausgewertet werden.
Damit gibt es einen Datenschatz, der im Gegensatz zu einigen aktuellen Kontroversen um das Training diverser KI-Systeme, ganz legal und rechtlich einwandfrei ausgewertet werden darf.
Und immerhin haben Forschende von Google und verschiedenen weiteren Forschungseinrichtungen damit eine ziemlich spannende KI trainiert, die als Diagnoseinstrument bei Atemwegserkrankungen zum Einsatz kommen soll. Es nennt sich HeAR für "Health Acoustic Representation", also in etwa "Darstellung des Gesundheitszustandes durch die Stimme".
Derartige Analysen existieren in der medizinischen Forschung schon lange, immerhin hört man meist sehr schnell heraus, wenn jemand anderes erkältet ist. Dafür wurden und werden in der Regel voruntersuchte Daten eingesetzt. Man weiß also, dass die jeweilige Stimme eine spezifische Krankheit mitschwingen lässt oder dass sie gesund ist.
Das Problem ist aber, dass die Anzahl dieser Daten sehr begrenzt ist. Nicht so beim Training von HeAR: Das System wurde mit dem wirklich riesigen Datensatz aus komplett unmarkierten Audiodateien trainiert.
Anschließend kamen wenige zusätzliche Stimme mit festgestellten Erkrankungen hinzu. Im vorliegenden Fall waren das Tuberkulose, COVID-19 und der Umstand, dass jemand raucht. Für ein neu entwickeltes System erscheinen die Resultate von 74 Prozent korrekt erkannten Tuberkuloseerkrankungen und 71 Prozent bei COVID-19 durchaus beachtlich.
Weitergehen soll es nun mit kontrollierten, klinischen Studien. Es wäre die erste Möglichkeit, nur durch die Stimme eine erste Diagnose zu erhalten. Auch wenn die Resultate noch ausbaufähig sind, handelt es sich hier um einen Test, der lediglich auf Gesprochenem basiert - weder invasiv noch aufwendig.