Musik hören auf dem Handy ist ein alter Hut. Das Smartphone statt der Zeitung, daran haben wir uns auch gewöhnt. Aber mit dem Telefon sprechen? Da hört die Akzeptanz auf. "Guck mal, der da hinten redet mit seinem Handy" – Nutzer von Diktiersoftware werden bisweilen behandelt wie exotische Sonderlinge. Das könnte sich mit Siri ändern: Die neue Sprachassistentin überzeugt auf Apples iPhone 4S und bringt ein Nischenprodukt auf den Massenmarkt. Statt kritischer Blicke gibt es jetzt überbordende Begeisterung.
Apple geht in der Nutzerfreundlichkeit einen Schritt nach vorne und lässt das mühsame Tippen hinter sich. Termine planen, Kurznachrichten schreiben, den Wetterbericht für morgen suchen – all das geht jetzt ohne Hände, nur mit der Stimme. Dass Siri in den USA auch Flüge buchen und den nächsten Italiener finden kann, ist nur selbstverständlich. Doch wie funktioniert das überhaupt?
Immer nett und hochdeutsch
Siri ist benannt nach der gleichnamigen Softwarefirma, die sich auf Spracherkennung spezialisiert hat. Apple kaufte das vielversprechende Unternehmen im April 2010 und beauftragte es mit der Fertigstellung einer eigenen Software. Herausgekommen ist ein Dienst, der nicht nur einzelne Begriffe versteht, sondern auch den Inhalt eines Satzes. Während primitivere Erkennungsdienste bei der Frage "Brauche ich morgen in Berlin einen Schirm?" die Antwort verweigern, antwortet Siri etwas holprig "Es ist kein Regen in der Vorhersage für Berlin morgen", darunter erscheint die Wetterprognose für die nächsten fünf Tage.
Um den Zusammenhang eines Satzes zu begreifen, muss Siri zunächst die einzelnen Wörter erkennen. Dazu zerlegt es die Lautkette – denn nichts anderes ist Sprache für eine Maschine – in ihre Grundbestandteile, die sogenannte Segmentierung. Dabei hört die Software solange zu, bis sie eine Pause bemerkt, dann folgt das nächste Segment. Schrittweise werden die Einzelteile anschließend mit einer Datenbank für Klangmuster verglichen und das Programm versucht herauszufinden, was der Sprecher gemeint haben könnte. Das ist nicht immer einfach, denn jeder Mensch spricht unterschiedlich, so wirken sich Gemütszustand oder Dialekte auf die Erkennungsgenauigkeit aus.
In unserem Test tat sich Siri mit Dialekten schwer, selbst einfache Fragen konnten mehrfach nicht beantwortet werden. Siri liebt Hochdeutsch – sowohl beim Zuhören als auch beim Antworten. Bei der Nachfrage, ob sie auch Bayerisch sprechen kann, sagt sie lediglich "Das würde ich lieber nicht beantworten..." Vielleicht ist das auch besser so.
Einfache Sätze bevorzugt
Der zweite wichtige Punkt in der Spracherkennung ist die Grammatik: Viele Menschen haben bereits in der Schule Probleme, die Grammatik zu verstehen. Für Maschinen ist die deutsche Sprache noch komplizierter. Verschachtelte Haupt- und Nebensätze, geteilte Verbformen, die unterschiedliche Betonung bei Fragen und Aussagesätzen – all das sind Phänomene, die für Computerlinguisten zur Herausforderung werden. Deshalb gilt die Faustregel: einfache Sätze mit möglichst konkreten Inhalt. Lange, komplizierte Sätze sowie Witz und Ironie werden für das Programm zum unüberwindbaren Hindernis. Spricht man langsam und ruhig, schafft Siri sogar Sätze wie "Obwohl es noch ein paar schöne Herbsttage gab, ist das Wetter jetzt endgültig schlecht geworden und es wird immer früher dunkler."
Doch nicht immer ist das Ergebnis für das Programm eindeutig. So gibt es Wörter, die gleich klingen, aber unterschiedliche Bedeutungen haben, wie arm/Arm oder fest/Fest. Manchmal sind die Wörter sogar identisch, beispielsweise das Wort Ball – gemeint ist entweder das Spielgerät oder das Tanzereignis. Hier muss das Programm auf den Kontext achten und mit statistischen Mitteln herausfinden, welches Wort zum Rest des Satzes passen könnte. Dabei wird nach der wahrscheinlichsten Kombination von Wörtern gesucht, die in einer Datenbank hinterlegt sind. Das macht nicht immer Sinn: Bei dem Satz "Ich rede gerade in mein Telefon" versteht Siri in mehreren Versuchen "Predige in mein Telefon." Allerdings wurden die restlichen Sätze einwandfrei erkannt, die Fehler halten sich in Grenzen.
Schlau dank Nachschlagewerk
Eine dieser Datenbanken ist die Suchmaschine Wolfram Alpha. Im Gegensatz zu Google liefert die Seite keine Treffer, sondern versucht, Antworten zu finden. Allerdings ist Wolfram Alpha zum Großteil nur auf Englisch verfügbar. Das führt auch bei Siri zu Problemen: Sind die Informationen nicht in Wolfram Alpha oder anderen Datenbanken vorhanden, weiß das Programm keine Antwort. Deshalb kann es in Deutschland auch noch keine Tipps geben, für die es auf Geo-Daten zugreifen muss. Die Suche nach dem nächstgelegenen Italiener oder die Entfernung zum nächsten Apple-Store wird in Deutschland keine Ergebnisse liefern. Bisher werden nur in den USA Umgebungsdaten berücksichtigt, andere Länder sollen 2012 folgen, darunter auch Deutschland und Frankreich. Im Grunde ist Siri also nur die Schnittstelle zwischen der Sprache des Nutzers und den Informationen, auf die das Programm Zugriff hat.
Gibt es Probleme?
So innovativ der neue Dienst ist, es gibt auch Schattenseiten. Auf der technischen Seite muss beachtet werden, dass Siri ohne eine Internetverbindung nicht funktioniert. Denn die Sprachbefehle werden direkt in die große Apple-Cloud in Amerika weitergeleitet, um dort analysiert zu werden – zum Unmut der Datenschützer. Denn das bedeutet, das Apple mitbekommt, was wir unser Handy fragen. Was genau übertragen und ausgewertet wird, ist nicht klar, ebenso wie gut die Daten verschlüsselt sind.
Mit Tricks auch auf dem iPhone 4
Siri funktioniert im Praxistest erstaunlich gut, die deutsche Version muss sich hinter ihrem amerikanischen Pendant nicht verstecken. Dass noch nicht alle Dienste in der deutschen Version funktionieren, ist bekannt – Apple betonte aber mehrfach, dass der Spracherkennungsdienst noch in einer Testphase steckt. Und dafür ist das Programm erstaunlich weit. Selbst bei lauter Geräuschkulisse versteht das Programm die Ansagen des Nutzers, dabei muss man nicht einmal besonders deutlich oder langsam sprechen. Nur bei Namen gerät das Programm etwas ins Trudeln, diese müssen des Öfteren noch einmal wiederholt oder manuell korrigiert werden.
Auch Nutzer des Vorgängermodells iPhone 4 können Siri mit einem Trick freischalten: Der Entwickler Steven Troughton-Smith installierte Siri und die entsprechenden Springboard-Dateien (die sind notwendig, um die Symbole auf dem Startbildschirm anzuordnen) des 4S auf dem iPhone 4 und brachte die Anwendungen auch auf dem iPhone-Vorgängermodell zum Laufen. Die auf Apple spezialisierte Webseite "9to5 Mac" berichtet, dass die App die gesprochenen Kommandos erkennt und dem Anwender antwortet. Die App funktioniert sowohl in der Standardausführung als auch über die Diktieransicht im Keyboard-Modus.
Lesen Sie auch bei unserem Partner macwelt.de - iOS 6 - Jetzt kommt Super-Siri.