Regional gefärbte Sprache von Jugendlichen aus ganz Deutschland wird jetzt in einer Datenbank gesammelt. Das Institut für Phonetik und Sprachliche Kommunikation der Ludwig-Maximilians-Universität in München stellte das Projekt "Ph@ttSessionz" vor. "Wir wollen technische Anwendungen verbessern, die speziell für Jugendliche entwickelt wurden", sagte Projektleiter Alexander Steffen bei der Deutschen Jahrestagung für Akustik (DAGA), die noch bis zum Donnerstag in München stattfindet.
Folgende Beispiele sind Textvorgaben für "Ph@ttSessionz"
Öl fehlte wohl auch. Sieglinde zeichnet eine Figur. Was macht denn dein verstauchter Fuß? Die Kartoffeln gehören zum Mittagessen. Zum Schnitzel gibt es Erbsen. Danach tut eine Wanderung gut. Zieht vielleicht die festen Schuhe an! Können wir nicht Tante Erna besuchen? Durch Wald und Feld führt unser Weg. Wir hören den plätschernden Bach. Hasen verschwinden im Dickicht. Voller Glück sind wir am Ziel.
"Wir gehen an die Grenzen"
Warum Softwareprogramme häufig Probleme mit der Spracherkennung haben, machte Steffen mit einem Beispiel deutlich: Für das einfache Wort "Zwei" seien allein in Bayern mit "Zwoa, Zwee, Zwa, Zwo" neben der hochdeutschen mindestens vier regionale Varianten im Umlauf. In der Datenbank soll diesen regionalen Unterschieden Rechnung getragen werden. Aus 25 Schulen in ganz Deutschland werden jeweils 50 Sprecher im Alter von 13 bis 18 Jahren aufgenommen. "Wir gehen an die Grenzen", kündigte Steffen an, "nach Chemnitz, Aachen und Saarbrücken".
Projekt läuft bis 2006
Den Schülern wird eine Liste mit allerlei Zahlen, Buchstaben und "phonetisch reichen" Sätzen zum Vorlesen vorgelegt. Am Ende der Aufnahme werden sie aufgefordert, frei zu erzählen. Wertvoll sind die Aufnahmen Steffel zufolge vor allem für Software-Entwickler, die an Spracherkennung beispielsweise für Handys und MP3-Spieler arbeiten. Nach Abschluss des aus Bundesmitteln finanzierten Projekts im Februar 2006 würden die Ergebnisse nahezu kostenlos auf der Wirtschaft zur Verfügung gestellt. "Davon können vor allem kleinere Software-Firmen profitieren", sagte Steffen.
Sprechergruppe bislang sehr begrenzt
Noch ist das Projekt begrenzt. Es werden ausschließlich Gymnasiasten aufgenommen, die Steffen zufolge "relativ wenig Dialekt" sprechen. Dem Phonetiker schweben deshalb Untersuchungen auch mit anderen Sprechergruppen vor. "Wir werden einen Sprachkorpus brauchen für ältere Menschen, zumal diese bald in der Mehrzahl sind", kündigte er an.