In het kort:
Het nieuwe AI-model van Google toont indrukwekkende vaardigheden in het begrijpen van gesproken content, maar heeft moeite met het interpreteren van visuele informatie.
- Beschikbaar voor alle Gemini-gebruikers, zowel gratis als betalend
- Werkt naadloos samen met andere Google-diensten zoals Search en Maps
- Kan video's van elke lengte analyseren en voorzien van tijdstempels
Het grote plaatje:
De technologie markeert een belangrijke stap in het automatisch verwerken van video-content, maar laat ook de huidige grenzen van AI zien.
- De AI kan complexe sportwedstrijden volgen en belangrijke momenten identificeren
- Bij interviews en documentaires worden kernpunten accuraat samengevat
- Het model mist echter cruciale visuele context die voor mensen vanzelfsprekend is