Logo van Ars Technica

-Tools

Google's Veo 3 brengt AI-video's met geluid naar nieuw niveau

Copyright arstechnica
Foto: VandaagAI.nl

Google introduceert baanbrekende video-AI die realistische mensen, dialogen en muziek kan genereren. Het model produceert 8 seconden durende clips in 720p resolutie, compleet met gesynchroniseerd geluid.

In het kort:

Veo 3 is Google's meest geavanceerde video-generator tot nu toe, waarbij het verschil tussen echt en AI-gegenereerd steeds moeilijker te zien is. Het systeem kost $1,50 per video en is beschikbaar via Google AI Ultra.

  • Het model combineert video-, audio- en taalmodellen om complete scènes te creëren
  • Videos worden voorzien van onzichtbare watermerken via SynthID technologie
  • Google filtert gevoelige content zoals geweld en seksueel materiaal

Het grote plaatje:

De technologie markeert een doorbraak in AI-videogeneratie, met name door de integratie van realistische audio en dialogen. Het systeem gebruikt diffusietechnologie en is waarschijnlijk getraind op YouTube-content.

  • Videos worden gegenereerd in 3-5 minuten
  • Het model kan complexe scenes creëren met meerdere personages
  • Audio-generatie omvat spraak, muziek en omgevingsgeluiden

De andere kant:

Hoewel indrukwekkend, vertoont het systeem nog steeds beperkingen. Sommige scenario's leiden tot onlogische resultaten, zoals verkeerde lipsynchronisatie of fysiek onmogelijke bewegingen. De grootste zorg is echter het potentieel voor misleiding, nu realistische video's voor iedereen toegankelijk worden.

Bronnen

Het belangrijkste nieuws gratis in je mailbox

Elke week een korte e-mail met de meest relevante verhalen.

Bekijk ook