Anzeige
Anzeige

HeyGen Hype um neue Übersetzer-KI: Das ist das Start-up hinter den viralen Videos

Plötzlich "Sprachgenie": KI-Dolmetscher lässt US-Regisseur Deutsch und Französisch sprechen
Sehen Sie im Video: Plötzlich "Sprachgenie" – KI-Dolmetscher lässt US-Regisseur Deutsch und Französisch sprechen.






Dieses Video sorgt derzeit für jede Menge Wirbel in den sozialen Medien.


Tech-Influencer und Regisseur Jon Finger spricht plötzlich verschiedene Sprachen – ohne sie je gelernt zu haben.


Der Clip wird allein auf "X", ehemals Twitter, innerhalb weniger Tage mehr als 5,8 Millionen Mal aufgerufen.


Das Online-Tool "HeyGen" sorgt mithilfe von künstlicher Intelligenz für die Übersetzung und legt diese lippensynchron und mit seiner Stimme auf das Ausgangsvideo.


Damit das funktioniert, muss das Video bestimmte Anforderungen erfüllen und mindestens 30 Sekunden lang sein.


Im Begleittext zu seinem Beitrag bittet Finger andere Nutzer um Feedback zur Qualität der Übersetzung.


Die Nutzer zeigen sich beeindruckt von der Technik, merken jedoch an, dass die Übersetzungen etwas roboterähnlich klingen würden.


Es gibt aber auch kritische Stimmen: Experten, wie der Google-Mitarbeiter Lutz Mache, merken an, dass das die Technologie auch missbräuchlich eingesetzt werden könne.


Künstliche Intelligenz wurde in der Vergangenheit wiederholt dafür genutzt, um Fake-Videos zu produzieren und bekannten Persönlichkeiten und Politikern Worte in den Mund zu legen.

Mal wieder sorgt eine Künstliche Intelligenz für Aufsehen: Sie lässt die Nutzer in allen möglichen Sprachen sprechen. Dahinter steckt HeyGen, ein Unternehmen aus den USA, das vor dem viralen Hit kaum bekannt war
Von Victoria Robertz

Französisch oder Hindi sprechen, ohne es je gelernt zu haben? Die KI eines US-Start-ups macht das jetzt möglich. Im sozialen Online-Netzwerk X (zuvor Twitter) ging diese Woche ein Video viral, in dem der Tech-Influencer Jon Finger eigentlich Englisch spricht – eine KI aber den Ton in eine andere Sprache umwandelt und sogar die Lippenbewegungen anpasst. Inzwischen haben auch viele andere die Software ausprobiert und ihre Ergebnisse online geteilt. Sie sprechen fließend Italienisch, Spanisch und Deutsch, obwohl sie im Original eine andere Sprache sprechen. Dass eine KI dahinter steckt, lässt sich kaum erkennen.

Entwickelt haben die KI Joshua Xu und Wayne Liang, Gründer des Start-ups HeyGen. Xu hat Informatik studiert, Liang Human-Computer Interaction. Sie gründeten das Unternehmen 2020 in Kalifornien. "Wir bauen ein KI-System auf, das die Kosten für die Erstellung von Inhalten erheblich senken könnte", schreibt Xu auf seinem Linkedin-Profil. Dabei geht es nicht nur um Übersetzungen, sondern zum Beispiel auch um Videos, die gänzlich ohne Kameras und Schauspieler auskommen.

Das Tool, mit dem das Übersetzungs-Video von Jon Finger erstellt wurde, befindet sich aktuell in einer offenen Testphase. Ein Video muss mindestens 30 Sekunden lang sein, damit man es bei HeyGen Labs hochladen kann. Die KI übersetzt, klont die Stimme der sprechenden Person und synchronisiert das Bild innerhalb weniger Minuten. Derzeit können von Italienisch bis Hindi zehn Sprachen eingegeben und in acht übersetzt werden.

"Die Zukunft der Video-Erstellung"

Doch eine KI, die Sprache und Bild übersetzt, ist für das Unternehmen nur ein Element. HeyGen stellt auf seiner Website bereits eine Art Video-Studio zur Verfügung. Über hundert Avatare können in mehr als 40 Sprachen menschenähnlich erzählen. Der Text kann entweder als Skript eingegeben oder als Audio-Datei hochgeladen werden. "Willkommen zur Zukunft der Videoerstellung", sagt der Avatar am Ende des Erklärfilms. Das Versprechen des Unternehmens: Kostengünstige Videos ohne aufwendige Bearbeitung. In ihrem Blog erklären die Gründer zum Beispiel, wie ihre Software zur Erstellung von Marketingkampagnen oder zum Onboarding neuer Mitarbeiter eingesetzt werden kann. Das günstigste Abo kostet derzeit knapp 50 Dollar pro Monat.

Anfang dieses Jahres erreichte das US-Start-up innerhalb weniger Monate einen wiederkehrenden Jahresumsatz von 1 Mio. US-Dollar, aus Sicht des CEO ein "bedeutender Meilenstein". Den steilen Anstieg des Umsatzes führt er allerdings nicht nur auf die Nutzerzahl zurück, sondern auf die Weiterentwicklung des KI-Umfelds insgesamt. Mit den Übersetzungsvideos zog das Unternehmen nun erstmals größere Aufmerksamkeit auf sich. Allein das Video von Jon Finger wurde 6,6 Millionen Mal angeschaut.

Auch wenn einige User anmerken, dass die Stimmen noch etwas mechanisch klingen, ist wohl davon auszugehen, dass sich diese KI – so wie zuletzt viele andere – in hoher Geschwindigkeit verbessern wird. Experten prognostizieren bereits, dass in Zukunft auch Live-Übersetzungen möglich sein könnten.

Andere warnen vor der Kehrseite des Ganzen: Zum einen könnte die Bereitschaft zum Sprachenlernen abnehmen. Zum anderen wird vor dem missbräuchlichen Gebrauch des Tools gewarnt. Sogenannte Deepfakes tauchen im Kontext von KI immer wieder auf, zum Beispiel in Form von Anrufen. Deepfakes nutzen KI, um etwa Gesichter oder Stimmen in Videos, in Audios und auf Fotos zu fälschen. Laut Bundesamt für Sicherheit und Informationstechnik (BSI) deuten aktuelle Forschungsergebnisse darauf hin, dass sich dieser Trend fortsetzen und die manuelle Erkennung von Fälschungen gleichzeitig immer schwieriger wird. Durch die erhöhte Verfügbarkeit an Tools wie HeyGen und den niedrigschwelligen Zugang dazu, werde es auch für Laien einfacher, hochwertige Fälschungen zu erstellen, so das BSI. Heygen zeigt, wie einfach es geht.

Dieser Artikel erschien zuerst hier bei den Kollegen auf Capital.de.

Mehr zum Thema

Newsticker

VG-Wort Pixel