Mai 6, 2024

Mixery Raw Deluxe

Nachrichten, ausgefallene Geschichten und Analysen zum deutschen und internationalen Geschehen. Tauchen Sie tiefer ein mit unseren Features aus Europa und darüber hinaus. Sehen Sie sich unseren 24/7-TV-Stream an.

Hätte es da Vinci gefallen?: So singt die Mona Lisa dank künstlicher Intelligenz.

Hätte es da Vinci gefallen?: So singt die Mona Lisa dank künstlicher Intelligenz.

Microsoft-Forscher stellten mit VASA-1 ein innovatives Modell für künstliche Intelligenz vor, das in der Lage ist, ein Standbild eines Gesichts und einen Ton aufzunehmen, um ein überzeugendes Video einer sprechenden Person zu erstellen. Die ersten Tests ließen nicht lange auf sich warten und eine Nachricht begann sich in den Netzwerken zu verbreiten. Mona Lisa ist Rapperin. Hätte Leonardo da Vinci das hören wollen?

VASA-1 wurde von Microsoft und „für Spiele“ entwickelt. Ein Bild einer Person und eine Audiospur genügen, der Rest wird gesungen. Nach Angaben des spanischen Medienunternehmens La Razón versuchte das Forschungsteam, Standbilder des Sprechens und Singens zu animieren, indem es die bereitgestellte Backup-Audiospur verwendete und dabei glaubwürdige Gesichtsausdrücke zeigte.



In jeder Animation ändert sich der Gesichtsausdruck mit den Worten, um das Gesagte zu betonen. Trotz des realistischen Charakters der Videos stellen die Forscher fest. Bei näherer Betrachtung können Fehler aufgedeckt werden Und der Beweis, dass sie künstlich geschaffen wurden.

Die Wirksamkeit des Systems wurde deutlich, als ein Video, in dem Mona Lisa einen Rap-Song sang, sofort viral ging und gleichzeitig jeder technologische Fortschritt in der Szene zu widersprüchlichen Meinungen in sozialen Netzwerken führte.

Technische Details

Das Modelltraining umfasst eine breite Palette von Gesichtsvideos, die es VASA-1 ermöglichen, natürliche Bewegungen wie Augenzwinkern, Gesichtsausdrücke und Blicke zu erkennen. Obwohl die erstellten Videos die Realität zeigen, weisen sie dennoch Anzeichen von Künstlichkeit auf.

Siehe auch  Android 12: Warnt Benutzer, wenn sie Kamera oder Mikrofon ausspionieren

Microsoft betont, dass sein Modell ähnliche Tools übertrifft Ermöglicht den Dialog zwischen Menschen und Systemen der künstlichen Intelligenz und legt den Grundstein für die Echtzeitinteraktion mit realistischen Avataren.

Dieser technologische Fortschritt ist zwar aufregend, wirft jedoch wichtige ethische und regulatorische Fragen auf, die vor einer breiten Umsetzung geklärt werden müssen.