Künstliche Intelligenz

Spotify nutzt KI, um die Stimmen von Podcastern zu klonen und zu übersetzen

Spotify hat eine bemerkenswerte neue Funktion vorgestellt, die auf künstlicher Intelligenz (KI) basiert und einen Podcast mit denselben Stimmen der Teilnehmer der Sendung in mehrere Sprachen übersetzt.

Möglich wurde dies zum Teil durch die gerade veröffentlichte Spracherzeugungstechnologie von OpenAI, die nur wenige Sekunden Hörzeit benötigt, um eine Stimme zu reproduzieren.

Laut Spotify sorgt die Funktion für „ein authentischeres Hörerlebnis, das persönlicher und natürlicher klingt als herkömmliche Synchronisation“, und fügte hinzu: „Eine ursprünglich auf Englisch aufgenommene Podcast-Episode kann jetzt in anderen Sprachen verfügbar sein, während die unverwechselbaren Sprachmerkmale des Sprechers erhalten bleiben.“

Ab heute stellt Spotify sprachübersetzte Episoden ausgewählter Ersteller zur Verfügung, wobei die Sendungen vom Englischen ins Spanische übersetzt werden. In den kommenden Tagen werden auch französische und deutsche Folgen verfügbar sein.

Spotify nutzt KI, um die Stimmen von Podcastern zu klonen und zu übersetzen

Zu den verfügbaren Episoden auf Spanisch gehören:

Lex Fridman-Podcast – Interview mit Yuval Noah Harari
Sesselexperte – Kristen Bell kehrt durch Gottes Gnade zurück
Das Tagebuch eines CEO mit Steven Bartlett – Interview mit Dr. Mindy Pelz

Alternativ können Sie den Sprachübersetzungs-Hub in der Spotify-App aufrufen, um alle übersetzten Sendungen anzuzeigen, die derzeit verfügbar sind. Neue Sendungen werden in den kommenden Wochen und Monaten hinzukommen.

Spotify sagte, dass rund 100 Millionen Menschen „regelmäßig“ Podcasts auf seiner Plattform hören, und sein neues KI-gestütztes Sprachübersetzungsangebot könnte Millionen weitere Hörer für Sendungen verbuchen, die plötzlich in neuen, riesigen Märkten landen.

Einer der Tests der neuen Funktion von Spotify wird sein, ob es dem Übersetzungselement gelingt, die Nuancen des Originaldialogs genau zu erfassen.

In jedem Fall sieht es nach einem weiteren Rückschlag für Synchronsprecher aus, da die Technologie leicht auf Filme und Fernsehsendungen übertragen werden könnte und die Stimmen einer ganzen Besetzung für internationale Versionen des Inhalts nachgebildet werden könnten.

LESEN  Sogar OpenAI hat den Versuch aufgegeben, ChatGPT-Plagiate zu erkennen

Die Technologie zum Klonen von Stimmen gibt es schon seit einiger Zeit und wird aufgrund der Fortschritte in der KI immer besser. Es überrascht nicht, dass es bereits auch für schändliche Zwecke eingesetzt wird und Strafverfolgungsbehörden immer mehr auf entsprechende Betrügereien aufmerksam werden. Es wird befürchtet, dass die Technologie auch zu einem Anstieg überzeugenderer Fehlinformationen führen könnte, da schlechte Akteure sie nutzen, um Audioaufnahmen von Politikern oder führenden Persönlichkeiten zu erstellen, die scheinbar Dinge sagen, die sie nicht gesagt haben.

Ähnliche Artikel

Schaltfläche "Zurück zum Anfang"