Meta bringt neues Tool zum Klonen von KI-Stimmen auf den Markt

Meta hat Audiobox vorgestellt, ein neues KI-gesteuertes Werkzeug zur Stimmklonung. Dieses Tool kann Sprache oder Soundeffekte basierend auf Textbefehlen generieren und Stimmen aus kurzen Aufnahmen klonen. Audiobox ist Teil eines Konzepts zur Entwicklung von Audiogenerierungsmodellen.

Das Tool ist als limitierte Demo konzipiert, um die Fähigkeiten des Modells zu demonstrieren und Entwickler zur Schaffung neuer Technologien anzuregen. Es wurde mit umfangreichen Daten trainiert, darunter 160.000 Stunden Sprache, 20.000 Stunden Musik und 6.000 Stunden Soundproben. Die Herkunft dieser Daten wurde nicht offengelegt.

Meta hat mehrere Sicherheits- und Ethikmaßnahmen implementiert, um einen verantwortungsvollen Einsatz von Audiobox zu gewährleisten. Dazu gehören Filter für Eingabeaufforderungen basierend auf geschützten Kategorien wie Rasse, Geschlecht, Religion und sensible Themen.

Benutzer können nur ihre eigene Stimme modifizieren. Audiobox enthält einen Stimmverifizierungsprozess, um das Hochladen fremder Stimmen zu verhindern. Die generierten Audiodateien enthalten ein ‚Audio-Wasserzeichen‘, das für das menschliche Ohr kaum wahrnehmbar, aber von Facebooks Technologie erkennbar ist.

Derzeit unterstützt das Tool nur die Generierung von englischsprachiger Sprache und ist nicht für kommerzielle Zwecke verfügbar. Aber Sie können die Leistung der Audiobox testen. Diese Entwicklung im Bereich der KI-Stimmklonung durch Meta ist ein bedeutender Schritt im schnell fortschreitenden KI-Bereich, wirft aber auch Fragen zur Auswirkung auf die Industrie und zu ethischen Überlegungen auf.

Alle Kommentare

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein

Mehr