Mit dieser KI können Sie Ihre Stimme deepfakeen, um wie Barack Obama zu sprechen

Frau Technik | Getty Images



Lernen Sie mein Alter Ego kennen, Katie:





Warum fliegen wir nicht mehr zum Mond?

Der Akzent, die Emotion und die Intonation sind alle von mir. Aber irgendwie klinge ich jetzt wie eine jüngere Frau mit einer hohen Stimme.

Meine Haut für die weibliche Stimme wurde erstellt von Modulieren.ai , ein Unternehmen mit Sitz in Cambridge, Massachusetts. Das Unternehmen nutzt maschinelles Lernen, um die Eigenschaften der Stimme auf eine leistungsstarke neue Weise zu kopieren, zu modellieren und zu manipulieren.

Die Technologie geht weit über die einfachen Sprachfilter hinaus, mit denen Sie wie Kylo Ren klingen können. Mit diesem Ansatz ist es möglich, jedes gewünschte Alter, Geschlecht oder jeden Ton in Echtzeit anzunehmen. Oder die Stimme eines Prominenten übernehmen. Ich kann ein längeres Telefongespräch in der Gestalt von Katie führen, wenn ich möchte.



Ich besuchte den Hauptsitz von Modulate, um mehr über die Technologie und die Ambitionen des Unternehmens zu erfahren und um die ethischen Implikationen des Einsatzes von KI zum Kopieren der Stimme eines anderen zu besprechen. In einer schallisolierten Kabine habe ich einige Voice Skins des Unternehmens ausprobiert.

Hier ist meine tatsächliche Stimme:

Und hier wird es durch eine andere Persona gespeist:



Und in Echtzeit zwischen den beiden Personas gewechselt zu werden.

Die Sprachmodellierungstechnologie ist nicht perfekt; jede neue Stimme ist ein wenig trällernd. Aber es ist bemerkenswert gut und verbessert sich, indem mehr Ihrer Sprachdaten verwendet werden. Und es zeigt, wie Fortschritte beim maschinellen Lernen die digitale Realität schnell verändern. Modulate verwendet Generative Adversarial Networks (GANs), um die Audioeigenschaften eines Sprachsignals zu erfassen und zu modellieren. GANs lassen zwei neuronale Netze gegeneinander antreten, um die Eigenschaften eines Datensatzes überzeugend zu erfassen und zu reproduzieren (siehe Der GANfather ).

Beweis für extradimensionale Wesen

Durch maschinelles Lernen ist es möglich geworden, die Gesichter zweier Personen in einem Video auszutauschen, und zwar mithilfe einer Software, die kostenlos aus dem Internet heruntergeladen werden kann (siehe Fake America great again ). KI-Forscher verwenden GANs und andere Techniken, um visuelle Szenen zu manipulieren und sogar vollständig heraufzubeschwören falsche Gesichter .

Modulate hat auf seiner Website einen Demonstrations-Stimmen-Skin von Barack Obama, und Mitbegründer und CEO Mike Pappas sagte, es wäre möglich, einen für jeden zu erstellen, wenn genügend Trainingsdaten vorhanden sind. Aber er fügt hinzu, dass das Unternehmen ohne die Erlaubnis des Eigentümers keinen Promi-Stimmen-Skin zur Verfügung stellen wird. Er besteht auch darauf, dass Täuschung nicht der Hauptpunkt ist.

Dies ist keine Technologie, die entwickelt wurde, um Menschen zu imitieren, sagt Pappas. Es wurde entwickelt, um Ihnen neue Möglichkeiten zu bieten.

Modulate zielt auf Online-Spiele wie Fornite oder Call of Duty ab, bei denen Spieler über ein Mikrofon mit Fremden chatten können. Dies kann das Spiel verbessern, aber auch Missbrauch und Belästigung Tür und Tor öffnen.

Wenn wir online interagieren und wirklich tiefe Erfahrungen machen wollen, sind Stimmen entscheidend, sagt Pappas. Aber einige Leute sind nicht bereit, ihre Stimme wirklich zu erheben. In manchen Fällen möchte ich vielleicht einfach nur anonym bleiben. In anderen Fällen habe ich Angst, mein Alter oder Geschlecht preiszugeben und belästigt zu werden.

Recyclingunternehmen für Solarmodule

Charles Seife , ein Professor an der NYU, der die Verbreitung von Fehlinformationen untersucht, sagt, dass die Technologie deutlich fortschrittlicher zu sein scheint als andere Technologien zur Sprachmodifikation. Und er sagt, dass die Art und Weise, wie KI jetzt Video und Audio manipulieren kann, das Potenzial hat, die Medien grundlegend zu verändern. Wir müssen anfangen, darüber nachzudenken, was die Realität ausmacht, sagt er.

„Bisher war die Qualität der Sprachumwandlungstechnologie so gering, dass man eine umgewandelte Stimme leicht unterscheiden kann“, fügt er hinzu Tuomas Virtanen , ein Experte für Stimmsynthese und -manipulation an der Universität Tampere in Finnland. „Aber ich kann mir vorstellen, dass die Qualität in naher Zukunft so gut sein wird, dass eine Konversion nicht ohne Weiteres festgestellt werden kann.“

Modulate ist sich bewusst, dass seine Technologie missbraucht werden kann. Das Unternehmen sagt, es werde Zusicherungen einholen, dass jeder Kunde, der die Stimme einer Person kopiert, die Erlaubnis dieser Person hat. Es hat auch eine Audio-Wasserzeichen-Technologie entwickelt, die verwendet werden könnte, um eine kopierte Stimme zu erkennen. Dies könnte beispielsweise eine Warnung ausgeben, wenn jemand bei einem Anruf eine falsche Stimme verwendet.

„Wir haben von Grund auf ethische Sicherheitsvorkehrungen in unser Unternehmen eingebaut“, sagt Carter Huffman, Mitbegründer und CTO, „von der Art und Weise, wie wir unsere Technologie verteilen, über die Auswahl der anzubietenden Voice-Skins bis hin zum Versehen unseres Audios mit Wasserzeichen zur Erkennung in sensiblen Umgebungen Systeme.

Modulate ist möglicherweise in der Lage, den Missbrauch seiner eigenen Technologie zu begrenzen, aber es ist möglich, dass andere ähnliche Technologien unabhängig voneinander entwickeln und sie Menschen zum Missbrauch zur Verfügung stellen. Die Frage ist, wie weit dies missbraucht werden könnte und wie versiert die Öffentlichkeit damit werden wird.

Pappas ist optimistisch, dass das Potenzial für KI-Fälschungen oft überschätzt wird. Es ist definitiv etwas, wo man sich dessen bewusst sein möchte, aber es ist nicht etwas, wo die Facetten der Gesellschaft zusammenbrechen, sagt er. Wir haben Werkzeuge, um damit umzugehen.

verbergen

Tatsächliche Technologien

Kategorie

Unkategorisiert

Technologie

Biotechnologie

Technologierichtlinie

Klimawandel

Mensch Und Technik

Silicon Valley

Computer

Mit News Magazine

Künstliche Intelligenz

Platz

Intelligente Städte

Blockchain

Reportage

Alumni-Profil

Alumni-Verbindung

Mit News Feature

1865

Meine Sicht

77 Mass Avenue

Treffen Sie Den Autor

Profile In Großzügigkeit

Auf Dem Campus Gesehen

Alumni-Briefe

Nachrichten

Wahl 2020

Mit Index

Unter Der Kuppel

Feuerwehrschlauch

Unendliche Geschichten

Pandemie-Technologieprojekt

Vom Präsidenten

Titelstory

Fotogallerie

Empfohlen