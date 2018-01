Es ist ein spannendes Phänomen. Wer einen sprachgesteuerten Lautsprecher wie Amazon Echo oder Google Home Zuhause hat, erfährt von Besuchern meist zwei Reaktionen: echte Begeisterung oder genauso intensive Ablehnung. Wer stelle sich denn eine Wanze ins eigene Zuhause, ist die beliebteste Frage. Tatsächlich deutet eine aktuelle Analyse der NSA-Leaks darauf hin, dass die Geheimdienste Sprachsteuerung lieben dürften - aber nicht, um uns alle live zu belauschen.

Dafür sind die Lautsprecher gar nicht gebaut. Sie hören zwar die ganze Zeit in den Raum, aufgenommen wird aber nichts. Erst wenn das Code-Wort ertönt - etwa Alexa oder OK Google - wird die Aufnahme gestartet und dann zur Verarbeitung ins Internet übertragen, damit die Sprachassistenten Alexa und Google Assistant eine Antwort geben können.



Ein Einsatz als Dauer-Lauschgerät wäre zwar theoretisch denkbar. Die ebenfalls mit Mikrofonen bestückten Smartphones sind da schlicht attraktiver: Sie sind überall dabei, lassen den Nutzer per GPS verfolgen und können neben Telefonaten auch gleich Chats mitschneiden.



Die Sprachlautsprecher sind für die Geheimdienste wegen eines anderen Aspekts spannend: für die genaue Identifikation der Stimme.

Wie ein Fingerabdruck über das Mikrofon

Stimmerkennung an sich ist nicht neu. Bereits während des Zweiten Weltkrieges wurde durch einen Vergleich von Aufnahmen nachgewiesen, dass Hitler nicht wie gemunkelt durch einen Doppelgänger ausgetauscht worden war. Damals wurden noch ausgedruckte Stimmfrequenzen optisch miteinander vergleichen. Heute sind NSA und Co. da weiter. Viel weiter. Das legt ein Artikel von "The Intercept" nahe. Die Seite beschäftigt sich seit Edward Snowdens Enthüllungen mit den geleakten NSA-Dokumenten.

Den Dokumenten zufolge konnte die NSA bereits 2006 Stimmen ähnlich zuverlässig zuordnen wie einen Fingerabdruck. Auch nach Modifikationen ließen sich Stimme und Sprachmuster zuverlässig zuordnen. Das hat enorme Auswirkungen: Personen lassen sich so selbst über sehr große Distanzen zuverlässig identifizieren - ohne dass man wissen muss, wo sie sich aufhalten. "Sobald man jemandes Stimme identifiziert hat, kann man sofort herausfinden, mit wem die Person gerade kommuniziert, solange man eine Aufnahme des Gesprächs hat", erklärte eine Expertin gegenüber "The Intercept". Als würde man permanent seinen Fingerabdruck oder DNA-Spuren um die Welt schicken.

Wie weit die Technologie heute ist, lässt sich wegen der Geheimhaltung nur schwer abschätzen. Neben der Person wurde schon 2006 auch die gesprochene Sprache samt Dialekt sowie das Geschlecht des Sprechenden automatisch erfasst. Die Geheimdienstmitarbeiter konnten so schon gezielt nach bestimmten Personengruppen suchen. So konnte man etwa Mobilfunkmasten in Afghanistan finden, über die regelmäßig in Arabisch telefoniert wurde - und hatte sehr einfach neue Al-Qaida-Standorte entdeckt. Auch andere Länder nutzen Stimmerkennung: Interpol forscht daran, in der Türkei wurden die Stimmen von Regime-Gegnern gesammelt, China will gleich ganze Bevölkerungsgruppen erfassen.

Gigantische Stimmen-Sammlung durch Alexa und Co.

Um eine Stimme zu identifizieren reichen wenige Sätze in guter Qualität - und hier kommen Google Home und Amazons Alexa ins Spiel. Die Lautsprecher haben gegenüber Smartphones zwei klare Vorteile: Sie werden nicht in lauten Außenumgebungen genutzt und ermöglichen deshalb klarere Aufnahmen. Vor allem aber speichern Google und Amazon jede der Aufnahmen in der Cloud. Die Geheimdienste müssen also die Konzerne nur per Durchsuchungsbeschluss auffordern, die Aufnahmen bestimmter Geräte herauszugeben und schon lassen sich die Stimmen mit anderen Aufzeichnungen abgleichen. Wie man seine eigenen Aufnahmen anhört und löscht erfahren Sie hier für Amazon und hier für Google.

Apples Siri eignet sich für solche Anfragen der Geheimdienste hingegen nicht: Der Konzern speichert die Aufnahmen zwar auch, sie werden aber nicht mit einzelnen Nutzerkonten verbunden, sind also nicht einer Person zuzuordnen. Der Grund dürfte das unterschiedliche Geschäftsmodell sein. Während Apple sein Geld mit der Hardware verdient, verbinden Google und Amazon die Anfragen mit den Nutzerprofilen, um gezielter Werbung anzeigen zu können. Sowohl Amazon Echo als auch Google Home können dafür sogar zwischen verschiedenen Sprechern unterscheiden. Während das bei Echo bislang nur auf Englisch funktioniert, hat Google die Funktion auch schon in Deutschland freigeschaltet.

Stimmerkennung boomt

Von Googles und Amazons Ansatz profitieren allerdings nicht nur die Unternehmen. Durch die größeren Datenmengen kann die Künstliche Intelligenz hinter den Sprachassistenten Alexa und Google Assistant schneller lernen, durch die Personalisierung kann sie besser auf die Wünsche der Nutzer eingehen. Vergleicht man sie mit Siri, sind beide bei komplexen Anfragen um Lichtjahre voraus. Die Firmen müssen also einen Kompromiss aus Privatsphäre und der Qualität des Dienstes finden.

Und das sollten sie bald tun. Der Markt mit der Stimmerkennung wird den Analysten von Tractica zufolge nur weiter wachsen, etwa 4 Milliarden Euro sollen im Jahr 2024 damit verdient werden. Sie soll in der Gesundheitsbranche, für Kredikarten-Bestätigung und bei Grenzkontrollen Einsatz finden. Dass es dabei durchaus moralische Konflikte gibt, ist den Behörden bewusst, verriet ein anonymer NSA-Mitarbeiter "The Intercept": "Die Regierung vermeidet es, über die Technologie zu sprechen, weil sie schwierige Fragen aufwirft, die sie lieber nicht beantworten wollen."