Es war eine Revolution: Mit dem Amazon Echo stellte der Handelsgigant 2014 den ersten Computer vor, der nur über Sprache gesteuert wird. Seitdem ist viel passiert, Alexa ist auch auf Deutsch erschienen, hat mit den Skills genannten Apps jede Menge neuer Fähigkeiten gelernt. Auch die Spracherkennung funktioniert besser den je. Nur schlauer ist Amazons Assistentin nicht geworden. Das will man jetzt ändern.

Das erklärte der für Alexa verantwortliche Amazon-Manager Ruhi Sarikaya in einem Vortrag bei der Entwicklermesse "World Wide Web Conference" und einem zugehörigen Blogpost. Die Kommunikation mit Alexa soll für den Nutzer natürlicher werden und so Hürden bei der Bedienung abbauen. Ein großes Ziel, dem man zunächst mit drei Schritten näher kommen will: Alexa soll durch eine verbesserte Kontexterkennung unkomplizierter Dialoge führen, endlich ein Gedächtnis bekommen, und man möchte die Nutzung der Skills intuitiver machen.

Alexa lernt Kontext

Vor allem ersteres dürfte das Gespräch mit Alexa deutlich natürlicher werden lassen. Schon jetzt kann die Assistentin sich merken, was im letzten Befehl gesagt wurde und darauf aufbauen. Wenn auf "Alexa, wie heißt das letzte Album von Adele?" ein "Alexa, spiel es ab" folgt, versteht sie, was man von ihr will. Jetzt wird das Ganze noch ausgebaut. Zum einen kann man bei der zweiten Ansprache endlich das Codewort Alexa weglassen. Das ist ein riesiger Schritt in Bezug auf die Natürlichkeit des Gesprächs - schließlich spricht man Menschen ja auch nicht bei jeder Anrede mit dem Namen an.

Zum anderen werden aber auch Rückfragen über mehrere Befehls-Bereiche möglich sein. Fragt man etwa nach dem Wetter in einer Stadt, kann man künftig auch ein "Und wie komme ich dort hin?" hinzufügen und Alexa schaltet von selbst vom Wetter in den Routenmodus. Vorher konnte Alexa nur Folgebefehle im selben Modus verarbeiten. Wie gut die verbesserte Kontext-Erkennung funktionieren wird, können wir bald ausprobieren: Beide Maßnahmen sollen demnächst in Deutschland, den USA und Großbritannien freigeschaltet werden.

Gedächtnis und Skills auf Zuruf

Die übrigen Verbesserungen bleiben leider zunächst den US-Nutzern vorbehalten. Dort soll Alexa demnächst ein Gedächtnis bekommen und sich Dinge auf Befehl merken können, etwa Geburtstage oder die Kleidergröße der Kinder. Fragt man dann später danach, kann Alexa die Daten wieder hervorkramen. Besonders aufregend klingt das zunächst nicht, laut Sarikaya ist es aber nur einer von vielen Schritten, die Erfahrung mit Alexa persönlicher zu gestalten.

Spannender ist die Neuerung, dass man Skills nun nicht mehr explizit aufrufen muss, sondern Alexa selbstständig erkennt, welcher Skill gerade gebraucht wird - und ihn bei Bedarf sogar selbst installiert. Sarikaya wählt als Beispiel eine App eines Reinigungsmittel-Herstellers, die auf die Frage nach dem Entfernen eines Ölflecks gleich von Alexa installiert wird und dann die passende Anleitung liefert. Bisher müsste man erst einmal selbst herausfinden, dass es einen solchen Skill gibt, ihn dann installieren und dann gezielt Alexa bitten, in dem Skill nach einer Lösung zu schauen.

Das Beispiel klingt nicht besonders spannend, die Idee dahinter ist es allemal: Aus den aktuell knapp 40.000 verfügbaren Skills den richtigen zu finden, ist enorm nervig. Auch dass man immer wieder betonen muss, in welchem Skill Alexa einen Befehl ausführen soll, nervte schon bei der Einführung der Skills. Da ist die automatische Erkennung schon ein gewaltiger Schritt nach vorne. Ob sie tatsächlich funktioniert, sollen US-Nutzer bald ausprobieren können.

Ein guter Anfang

Ein echter Durchbruch sind die angekündigten Neuerungen zwar noch nicht, als wichtige Schritte in die richtige Richtung gehen sie aber allemal durch. Auch Amazon ist das bewusst. Man kratze gerade erst an der Oberfläche dessen, was möglich ist, schreibt Sarikaya. In Zukunft will man noch weiter an der Sprach- und Kontexterkennung arbeiten, die Dialoge noch natürlicher gestalten und die Erfahrung noch persönlicher machen. Zudem stehe man mit der Anpassung an die immer größer werdende Zahl von Alexa-Geräten und Skills noch vor ganz anderen Herausforderungen. Bis wir uns mit Alexa unterhalten können wie mit einem Menschen, wird es aber wohl noch Jahre dauern.