Wer kennt das Problem nicht? Mühsam hat man sich durch die Bedienungsanleitung für den neuen Videorekorder gearbeitet, alle Anweisungen akribisch befolgt und am Ende wird die gewünschte Sendung dennoch nicht aufgezeichnet. Solche frustrierenden Erlebnisse sollen bald der Vergangenheit angehören. Die Technik lernt, den Menschen zu verstehen, nicht umgekehrt. Der Schlüssel heißt Sprachtechnologie. Keine Tastatur, keine Maus - es zählt das gesprochene Wort.
"Bitte Tagesschau aufnehmen!"
"Die Sprache spielt eine ganz zentrale Rolle, weil sie für unsere Kommunikation unabdingbar ist", sagt Stephan Busemann, der stellvertretende Leiter des Bereichs Sprachtechnologie am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Saarbrücken. Die Computer zerhacken beim Zuhören gewöhnlich das Gesprochene in so genannte Phoneme, die akustischen Grundbausteine von Wörtern. Aus der Analyse der Schallwellen rekonstruieren die Rechner dann mit Hilfe eines eingebauten Wortschatzes Silben, Wörter und Sätze. Die Forscher haben freilich mehr im Sinn als nur ein "Bitte die Tagesschau aufnehmen!" an den Videorekorder.
Im Web
Das Auge spricht mit
Manche Visionen erinnern noch an Science-Fiction. Wie das vom DFKI koordinierten Projekt "SmartKom": Nicht allein über das Sprechen, selbst durch Gesten und Mimik sollen die Benutzer in Zukunft ihre Geräte bedienen können. Und das nicht nur vor einem fest stehenden High-Tech-Terminal zu Hause, sondern auch im Auto oder zu Fuß in der Innenstadt. Damit künftige Elektronik uns die Wünsche wortwörtlich von den Augen abliest, testen die DFKI-Forscher unter anderem, wie Augenbewegungen und Sprache miteinander verknüpft sind.
Ein Beispiel: Nach einem Einkaufsbummel entscheidet sich ein Nutzer zu einem spontanen Theaterbesuch. Er spricht in ein kleines an der Kleidung befestigtes Mikrofon. Auf einem Gerät in der Größe eines Mobiltelefons erscheint das aktuelle Programm mit der Option, für die einzelnen Stücke per Fingerzeig Karten zu ordern oder mit einem missbilligenden Stirnrunzeln abzulehnen. Eine Stimme aus einem "Knopf im Ohr" beschreibt dann den Weg zum ausgewählten Schauspielhaus.
Der Sprung vom Labor in den Alltag ist noch ungewiss
"Technologisch ist vieles davon schon möglich", berichtet Busemann. Darauf, ob und wann sich die Technik durchsetzt, will der Wissenschaftler sich nicht fest legen: "Da wage ich keine Vorhersage. Das wird auch vom Preis abhängen."
Den Wunsch der Menschen nach einer einfachen neuen Welt hat auch die Politik erkannt. Mit insgesamt 82,6 Millionen Euro hat die Bundesregierung in den vergangenen vier Jahren "SmartKom" sowie fünf weitere Leitprojekte zur Mensch-Technik-Interaktion (MTI) gefördert. Zahlreichen Unternehmen war das Feld ebenfalls Investitionen wert, so dass insgesamt 152,2 Millionen Euro flossen. Die deutschen MTI-Projekte gelten nach Angaben des Bundesforschungsministeriums inzwischen als führend in der Welt.
Durchbruch mit dem Verbmobil
Seit rund 25 Jahren nehmen Wissenschaftler verschiedener Disziplinen sich der Verbesserung des Zusammenspiels zwischen Mensch und Maschine an. In der Sprachtechnologie gilt das ebenfalls vom DFKI koordinierte Übersetzungsprojekt "Verbmobil" (1993-2000) vielen als Durchbruch. "Verbmobil" erkennt gesprochene Sprache, übersetzt sie ins Englische, erzeugt einen Satz und spricht ihn aus. Das Projekt erhielt 2001 den Zukunftspreis des Bundespräsidenten.
Spracherkennung: früher belächelt
Die früher wegen ihrer Fehleranfälligkeit oft belächelte Spracherkennung findet inzwischen aber nicht mehr allein in den Entwicklungslaboren statt. Der Arzt, der seinem Computer Briefe diktiert, ist bereits Realität. Auch manche Call Center, in denen einfach strukturierte Dialoge wie etwa bei Ticketverkäufen geführt werden, kommen schon ohne Mitarbeiter aus Fleisch und Blut aus. Auch maschinelle Übersetzungen zählen zu diesen "Dialogsystemen". Busemann ist überzeugt: "Durch das Zusammenwachsen der Europäischen Union entsteht hier Bedarf."
Stetiges Wachstum
Das Ende der Entwicklung ist noch lange nicht erreicht. "Es ist kein Riesenmarkt, aber er ist noch immer sehr wachstumsintensiv", sagt der Leiter Produktstrategie und Marktbeobachtung des Sprachtechnologie-Software-Herstellers VoiceObjects in Bergisch- Gladbach, Tiemo Winterkamp. Weltweit würden jährlich einige 100 Millionen Dollar umgesetzt. Und das Marktforschungsunternehmen Datamonitor sagt der Branche bis zum Jahr 2007 ein jährliches Wachstum von rund 40 Prozent voraus. In Zeiten der allgemeinen Wirtschaftsflaute ein beachtlicher Wert.