Respeecher
| Respeecher | |
|---|---|
| Allgemeines | |
| Gründer: |
|
| Leiter: |
Alex Serdiuk (CEO) |
| Mitarbeiter: |
34 (Stand: September 2022) |
| Sitz: | |
| Produkte: |
Stimmenreplizierung durch künstliche Intelligenz |
| Historische Informationen | |
| Gründungsjahr: |
Februar 2018 |
Respeecher ist ein ukrainisches Start-Up-Unternehmen auf dem Gebiet der künstlichen Intelligenz, das sich darauf spezialisiert hat, menschliche Stimmen digital zu replizieren. Die im Februar 2018 gegründete Firma erzielte durch den Einsatz künstlicher Intelligenz bedeutende Fortschritte auf dem Gebiet und ist dazu in der Lage, mit geringen Mengen an Referenzmaterial jegliche menschliche Stimme zu imitieren. Ein besonderer Vorzug der Respeecher-KI besteht in der Möglichkeit des digitalen De-Agings von Stimmen. Respeecher erlangte Bekanntheit durch die digitale Replikation der Stimmen von Prominenten wie Vince Lombardi und Aloe Blacc. Die Firma leistete mehrere Beiträge zu den Star-Wars-Realfilmserien The Mandalorian, Das Buch von Boba Fett und Obi-Wan Kenobi. Im September 2022 räumte der inzwischen verstorbene James Earl Jones, der die Stimme des Sith-Lords Darth Vader zu der englischen Originalfassung der Star-Wars-Filme beitrug, Respeecher die Rechte ein, seine Stimme auch in Zukunft zu replizieren und zu de-agen.
Geschichte[Bearbeiten]
Gründung von Respeecher[Bearbeiten]
Respeecher wurde im Februar 2018 von den Freunden Alex Serdiuk, Dmytro Bielievtsov und Grant Reaber in der ukrainischen Hauptstadt Kyiv gegründet. Mit der Gründung ihres Start-Ups verfolgten die drei Unternehmer die Idee, die menschliche Stimme einfacher für Computersysteme replizierbar zu machen.[1] Enttäuscht von den vorhandenen Text-zu-Sprache-Lösungen, die meist eher robotisch anmutende, unangenehme Stimmen produzieren, setzten sie sich das Ziel, die menschliche Stimme mittels digitaler Signalverarbeitungsalgorithmen mit proprietären generativen Modellierungstechniken vollständig akustisch zu analysieren.[2] Im Gegensatz zu bisherigen Text-zu-Sprache-Lösungen, die ihre Limitationen in ihrer Fokussierung auf Vokabel- und Silbendatenbanken finden und kaum dazu in der Lage sind, die Emotionen des Sprechers zu transportieren, sollte es der rein akustische Ansatz der Respeecher-KI erlauben, das Timbre und subtile Modulationen eines Sprechers zu reproduzieren.[3] Im ersten Halbjahr nach der Firmengründung absolvierten die Leiter von Respeecher das Trainingsprogramm Comcast NBCUniversal des Investmentunternehmens Techstars, das mittlerweile neben ff Venture Capital, Investment Capital Ukraine und Acrobator Ventures zu seinen größten Investoren zählt. Die Kapitalgesellschaften beteiligten sich im März 2020 neben diversen weiteren kleinen Investoren mit 1,5 Millionen US-Dollar an dem Start-Up. Nach der Fertigstellung einer stabilen Version der Respeecher-KI nutzten die Techniker des Unternehmens Aufnahmen des früheren US-Präsidenten Barack Obama für einen ersten Probedurchlauf. Als das Ergebnis professionellen Standards genügte, begann Respeecher damit, seine Leistungen verschiedenen Hollywood-Studios anzubieten.[1] Respeecher bietet Filmschaffenden die Möglichkeit, Stimmen gefragter Darsteller für kurze Cameo-Auftritte oder Synchronisationen digital zu erzeugen, die Stimmen bereits verstorbener Persönlichkeiten zu rekreieren, Prominente in anderen Sprachen sprechen oder sogar singen zu lassen und die Stimmen von Darstellern bis ins Kindesalter zu de-agen.[4] Im Jahr 2019 wirkte Respeecher an der Produktion des Deepfake-Kurzfilms In Event of Moon Disaster mit und steuerte eine digital reproduzierte Stimme des früheren US-Präsidenten Richard Nixon bei, was dem Unternehmen im September 2021 einen Emmy einbrachte.[1] Angesichts des mit Respeecher-KI einhergehenden Missbrauchspotenzials fühlt sich das Unternehmen der Einhaltung ethischer Standards besonders verpflichtet. So erlaubt es keine Nutzung seiner Stimmreplikationstechnologie in betrügerischer Absicht. Darüber hinaus holt das Start-Up stets eine Erlaubnis der Originalsprecher ein, um ihre Privatsphäre und Erwerbsmöglichkeiten zu erhalten. Außerdem hat sich Respeecher zur Entwicklung automatischer Erkennungsalgorithmen verpflichtet, die synthetische Sprache auch ohne Kennzeichnungen wie Wasserzeichen erkennen können sollen, und hat sich das Ziel gesetzt, eine umfassende Kennzeichnungspflicht synthetischer Inhalte wie Deepfakes auf Massenplattformen wie Facebook und YouTube zu erwirken.[5]
Mitwirkung bei Star-Wars-Produktionen[Bearbeiten]
Während der Produktion der zweiten Staffel der erfolgreichen Realfilmserie The Mandalorian im Jahr 2020 wurde die mit der Tonproduktion betraute Lucasfilm-Abteilung Skywalker Sound auf Respeecher aufmerksam. Für das Staffelfinale Kapitel 16: Die Befreiung wurde die Darstellung des Jedi-Meisters Luke Skywalker, ursprünglich verkörpert von Mark Hamill, nötig. Da Hamill zum Zeitpunkt der Dreharbeiten bereits 69 Jahre alt war, konnte er weder optisch noch stimmlich glaubhaft einen 30-jährigen Luke Skywalker verkörpern. Daher setzte Lucasfilm den Stand-In-Schauspieler Max Lloyd-Jones ein, während Hamill für ein digitales De-Aging-Programm, ein oftmals in Filmen des Marvel Cinematic Universe eingesetztes Patent des Disney-Konzerns, Modell stand. Lloyd-Jones' Gesicht wurde anschließend durch Hamills digital verjüngtes Gesicht ersetzt.[6] Um Hamills Stimme wie die eines 30-jährigen Skywalker klingen zu lassen, konsultierte die Verantwortlichen bei Skywalker Sound Respeecher. Das Start-Up verjüngte daraufhin mithilfe von Archivaufnahmen Hamills Stimme. Infolge der medienwirksamen Mitarbeit an der beliebten Streamingserie beauftragte die US-amerikanische Footballliga NFL Respeecher kurz danach mit der Replikation der Stimme der verstorbenen Football-Trainerlegende Vince Lombardi für einen Halbzeit-Werbespot des Super Bowl LV. Für den erneuten Auftritt Luke Skywalkers in der Episode Kapitel 6: Aus der Wüste kommt ein Fremder der Nachfolgeserie Das Buch von Boba Fett, erstmals ausgestrahlt am 2. Februar 2022, steuerte Respeecher abermals eine verjüngte Stimme von Mark Hamill bei.[1]
Zeitgleich mit der Produktion der Stimme für Das Buch von Boba Fett trat der Skywalker-Sound-Mitarbeiter Matthew Wood an Respeecher heran, um das Unternehmen für das laufende Serienprojekt Obi-Wan Kenobi zu gewinnen. Im Laufe der Serie sollte Darth Vader etwa 50 Textzeilen sprechen. Allerdings hatte der Original-Sprecher des Sith-Lords, der mittlerweile 91-jährige James Earl Jones, Lucasfilm bereits während der Dreharbeiten zu Episode IX – Der Aufstieg Skywalkers, zu dem er eine Textzeile beitrug, mitgeteilt, den Charakter angesichts seines hohen Alters künftig nicht mehr sprechen zu wollen. Überzeugt von dem Gefühl, echte menschliche Stimmen zu vernehmen, das er beim Hören der von Respeecher synthetisierten Stimmen verspürte, präsentierte Wood Jones Respeechers bisherige Arbeiten an Star-Wars-Formaten. Daraufhin erlaubte es der Schauspieler, Archivaufnahmen seiner Stimme zu verwenden, um die Respeecher-KI zu trainieren und Vaders Stimme so für immer für Lucasfilm verfügbar zu machen. Im Laufe der Produktion von Obi-Wan Kenobi hielten die Techniker von Respeecher engen Kontakt mit der Regisseurin Deborah Chow und erhielten mehrfach Hinweise von Jones, um die Bedrohlichkeit in Vaders Stimme zu perfektionieren. Insgesamt schickte Respeecher Skywalker Sound über 10.000 Sounddateien für die 50 Textzeilen – jeweils Detailkorrekturen oder Textänderungen, die aus dem Fortgang der Dreharbeiten resultierten. Als die Russische Föderation am 24. Februar 2022 ihren Überfall auf die Ukraine eröffnete, waren die Arbeiten an der Darth-Vader-Stimme noch nicht abgeschlossen. Der mit einigen Textzeilen betraute Toningenieur Bogdan Belyaev entschied sich nach den ersten russischen Luftangriffen in der Befürchtung, in Kürze keinen Zugang zum Internet mehr zu haben, dazu, eine vorfinale Version seiner Beiträge an Skywalker Sound zu schicken, um das Projekt im schlimmsten Falle zumindest zu einem Abschluss gebracht zu haben. Die übrigen Mitarbeiter des Unternehmens in der zu Kriegsbeginn stark beschossenen Hauptstadt Kyiv setzten ihre Arbeit ebenfalls in ihren provisorischen Luftschutzräumen wie etwa einem verbarrikadierten Theater fort, um den vertonten Dialogzeilen den letzten Feinschliff zu geben. Obwohl Wood dem Unternehmen in Sorge um das Wohlergehen der Mitarbeiter anbot, die bereits gelieferten Dateien zu verwenden, um sie in der Krisenlage nicht zur Weiterarbeit zu nötigen, bestand Respeecher darauf, den Auftrag zu finalisieren. Alex Serdiuk, der CEO des Unternehmens, hoffte, durch diesen Einsatz den Erfindungsgeist und die Tatkraft der zu diesem Zeitpunkt schwer attackierten Ukraine in die Welt tragen zu können.[7] Lucasfilm übernahm die von Respeecher produzierten Textzeilen in die dritte bis sechste Folge von Obi-Wan Kenobi.[1]
Im weiteren Verlauf des russischen Angriffskriegs in der Ukraine gelang es Respeecher, nahezu unterbrechungsfrei weiterzuarbeiten, unter anderem an der Stimme des Sängers Aloe Blacc, der einen Tribut an den verstorbenen schwedischen Musikproduzenten Avicii in verschiedenen Sprachen produzieren ließ, sowie der des verstorbenen Rock-'n'-Roll-Sängers Elvis Presley für das Finale der Castingshow America Got Talent. Eigenen Angaben zufolge ist Respeecher derzeit an einer Vielzahl laufender Hollywood-Produktionen beteiligt.[1] Für die Produktion des Science-Fiction-Horrorfilms Alien: Romulus unterstützte Respeecher den verantwortlichen Sounddesigner Will Files dabei, die Stimme des verstorbenen Darstellers Ian Holm für den Androiden Rook aufzubereiten. Da aus den Aufnahmen des Androiden Ash aus dem Film Alien – Das unheimliche Wesen aus einer fremden Welt nicht genügend Material hervorging, um die Respeecher-KI adäquat mit Trainingsdaten auszustatten, digitalisierte der Dialogue Supervisor Polly McKinnon über 20 Tonaufnahmen von Ian Holm aus dem Disney-Archiv.[8]
Kontroverse um Der Brutalist und Emilia Pérez[Bearbeiten]
Im Jahr 2024 wurde Respeecher von den Produzenten des Musical-Thrillers Emilia Pérez engagiert, um den Gesang der von Karla Sofía Gascón dargestellten Titelfigur Emilia Pérez zu verbessern. Der Film gewann im Rahmen der 97. Verleihung der Oscars im Jahr 2025 zwei Academy Awards, darunter auch den für den besten Song.[9] Mithilfe der von Respeecher angebotenen KI-Lösung verblendeten die Produzenten den Gesang einer anderen Sängerin mit Karta Sofia Gascóns Stimme.[10] Im selben Jahr unterstützte Respeecher die Produzenten des Filmdramas Der Brutalist. Die KI-Lösung des Unternehmens half dabei, auf Ungarisch eingesprochene Dialogpassagen der Hauptdarsteller Adrien Brody und Felicity Jones an die korrekte ungarische Aussprache anzupassen. Den Produzenten des Films war es dabei wichtig, die von den Schauspielern transportierten Emotionen zu erhalten, gleichzeitig aber auch eine möglichst authentische Aussprache der ungarischen Textpassagen zu erzielen. Weder Brody noch Jones waren zuvor des Ungarischen – einer der komplexesten und am schwierigsten auszusprechenden Sprachen der Welt – mächtig, hatten aber für den Film ein umfangreiches Sprach- und Dialekttraining erhalten, sodass Respeecher nur noch geringfügige Anpassungen vornehmen musste. Der Brutalist wurde bei der Oscarverleihung 2025 für zehn Academy Awards nominiert und gewann drei Auszeichnungen.[11]
Die zahlreichen Nominierungen und Auszeichnungen für beide Filme lösten eine kontrovers geführte öffentliche Debatte um die Nutzung künstlicher Intelligenzen in der Filmproduktion aus. Hintergrund war, dass hierdurch die Leistungen der Darsteller kaum noch sinnvoll zu bewerten sein würden. Im Nachgang der Oscarverleihung 2025 prüfte die Academy of Motion Picture Arts and Sciences eine Verpflichtung der Teilnehmer künftiger Oscarverleihungen zur Offenlegung der Nutzung künstlicher Intelligenzen.[12] Im Vorfeld der Oscarverleihung 2026 ergänzte die Academy ihr Regelwerk um eine Regelung für den Einsatz künstlicher Intelligenzen bei der Filmproduktion. Danach soll der Einsatz generativer KI-Werkzeuge und anderer digitaler Tools weder positive noch negative Auswirkungen auf die Bewertung haben. Vielmehr solle bei der Beurteilung der für die jeweilige Auszeichnung relevanten Leistung beurteilt werden, inwieweit ein Mensch im Mittelpunkt des kreativen Schaffens stand.[13]
Credits[Bearbeiten]
- In Event of Moon Disaster (2019)
- The Mandalorian (2020)
- Das Buch von Boba Fett (2022)
- Obi-Wan Kenobi (2022)
- Goliath (2023)
- Neue Geschichten vom Pumuckl (2023)
- Nyad (2023)
- Dangerous Waters (2023)
- The Exorcist: Believer (2023)
- Alien: Romulus (2024)
- Better Man (2024)
- Crooks (2024)
- Emilia Pérez (2024)
- Here (2024)
- Sunny (2024)
- The Brutalist (2024)
- Unter Uns (2024)
Weblinks[Bearbeiten]
- Voice Cloning for Content Creators auf Respeecher.com
Einzelnachweise[Bearbeiten]
- ↑ 1,0 1,1 1,2 1,3 1,4 1,5 About Us auf Respeecher.com
- ↑ Voice Cloning Powered by Artificial Intelligence auf Respeecher.com
- ↑ Voice cloning F.A.Q. auf Respeecher.com
- ↑ Respeecher for Film and TV auf Respeecher.com
- ↑ Ethics auf Respeecher.com
- ↑ Mandalorian's Luke Skywalker Without CGI: Mark Hamill, Deep Fake & Deaging auf ScreenRant.com
- ↑ Darth Vader's Voice Emanated From War-Torn Ukraine auf VanityFair.com
- ↑ Behind Alien: Romulus’ Awe-Inspiring Sound – a film sound deep-dive with Lee Gilmore and Will Files auf ASoundEffect.com
- ↑ How Respeecher's AI Voice Synthesis Technology Perfected Singing in “Emilia Pérez” auf Respeecher.com
- ↑ What 'The Brutalist’ and 'Emilia Pérez' AI Controversy Means for the Oscars auf Cosmopolitan.com
- ↑ Respeecher Helps Perfect Hungarian Pronunciation for Award-Winning Performance in The Brutalist auf Respeecher.com
- ↑ Oscar-Academy erwägt Regeländerung für künstliche Intelligenz auf Spiegel Online
- ↑ Awards Rules and Campaign Promotional Regulations Approved for 98th Oscars auf Press.Academy.com