Google-KI kann Einzelstimmen aus einer Menschenmenge herausfiltern

Menschen können unter gewissen Anstrengungen Stimmen aus einer Menschenmenge heraushören, insbesondere wenn dabei, wie beim sogenannten „Cocktailparty-Phänomen“, für sie besonders relevante Begriffe, wie der eigene Name, fallen. Computer können dies bisher weniger gut, eine neue Google-KI beweist das Gegenteil und verspricht viele sinnvolle, aber auch beunruhigende Anwendungsfälle.

Christian Hintze, Veröffentlicht am 13.04.2018

Audio Security

Beim Cocktailparty-Phänomen hören Menschen aus dem Stimmgewirr einer Party plötzlich ihren eigenen Namen heraus und auch sonst sind Menschen in der Lage bewusst Stimmen aus Menschenmengen herauszufiltern. Einer von Google entwickelten Deep-Learning-Engine gelingt dies nun auch, teilweise sogar deutlich besser als dem Menschen.

Die Künstliche Intelligenz kann spezifische Audiospuren von Personen isolieren, indem sie die Gesichter beim Sprechen anschaut und auswertet. Das Entwicklerteam trainierte das künstliche neuronale Netzwerk zunächst darin individuelle Sprecher zu erkennen, wenn diese alleine sprechen. Daraufhin kreierten sie virtuelle Parties, inklusive Hintergrundgeräusche, um der KI das Isolieren von mehreren Stimmen in separate Audio Tracks beizubringen.

Die Ergebnisse sind erstaunlich, wie sich gut anhand des Videos nachvollziehen lässt. Selbst wenn Personen direkt gegeneinander ansprechen, schafft es die KI beide Stimmen in einer separaten Audiospur abzulegen. Das klappt selbst dann, wenn das Gesicht des Sprechers temporär abgedeckt wird, bspw. durch ein Mikrofon.

Die möglichen Anwendungsfälle liegen auf der Hand: Das Entwicklerteam spricht von den Möglichkeiten u.a. bei Videotelefonaten in lauter Umgebung, wo die Technik dabei helfen könnte die lauten Geräusche zu blockieren. Aber natürlich dürfte eine ganz andere Industrie ebenfalls Gefallen an der Technik finden: Bei der Überwachung von Personen wäre eine Aufzeichnung verschiedener, klarer Audiospuren je Person natürlich extrem hilfreich.

Verwandte Artikel

Loading Comments

Diesen Artikel kommentieren / Antworten

Fortnite ist nach einem Tag offline...

Wie man 4K UHD-Videoaufnahmen im Re...

Teilen Sie diesen Artikel, um uns zu unterstützen. Jeder Link hilft!

Christian Hintze - Managing Editor - 2197 Artikel auf Notebookcheck veröffentlicht seit 2016

Ein C64 markierte meinen Einstieg in die Welt der PCs. Mein Schülerpraktikum verbrachte ich in der Reparaturabteilung eines Computerladens, zum Abschluss durfte ich mir aus “Werkstattresten” einen 486er PC selbst zusammenbauen. Folglich begann ich später ein Informatikstudium an der Humboldt-Uni in Berlin, Psychologie kam hinzu. Nach meiner ersten Arbeit als wissenschaftlicher Mitarbeiter an der Uni ging ich für ein Jahr nach London und arbeitete für Sega an der Qualitätssicherung von Computerspielübersetzungen, u.a. an Spielen wie Sonic & All-Stars Racing Transformed oder Company of Heroes. Seit 2017 schreibe ich für Notebookcheck.

> Notebook Test, Laptop Test und News > News > Newsarchiv > News 2018-04 > Google-KI kann Einzelstimmen aus einer Menschenmenge herausfiltern

Autor: Christian Hintze, 13.04.2018 (Update: 15.08.2024)