OpenAI maakt fotomanipulatie zo simpel als typen

In het kort:

GPT Image 1.5 markeert een keerpunt in toegankelijke beeldbewerking door geavanceerde fotomanipulatie binnen handbereik van iedereen te brengen.

Het model genereert beelden vier keer sneller dan zijn voorganger en kost 20 procent minder via de API.
Anders dan eerdere modellen gebruikt GPT Image 1.5 een "native multimodal" aanpak waarbij tekst en beelden als dezelfde soort data worden behandeld.
Je kunt nu converseren met de AI over een foto en deze stap voor stap verfijnen, net zoals je een e-mail zou bijschaven in ChatGPT.

Het grote plaatje:

De doorbraak zit in de manier waarop het model werkt: het behandelt beeldpixels en woorden als identieke "tokens" die voorspeld kunnen worden. Waar DALL-E 3 nog gebruikmaakte van diffusietechnieken, verwerkt GPT Image 1.5 jouw woorden en beeldpixels in één uniforme ruimte, waardoor het makkelijker kan omgaan met complexe bewerkingen zoals het veranderen van poses of het renderen van scènes vanuit een andere hoek.

OpenAI maakt fotomanipulatie zo simpel als typen

OpenAI's nieuwe GPT Image 1.5 reduceert complexe fotobewerking tot het intypen van een zin. Waar je vroeger Photoshop-expertise nodig had, volstaat nu gewoon converseren met AI.

In het kort:

Het grote plaatje:

Bronnen

Het belangrijkste nieuws gratis in je mailbox

Meer tools

Google lanceert Lyria 3 muziekgenerator gratis

Google rolt een nieuwe AI-muziekgenerator uit die in 30 seconden complete nummers kan maken, inclusief teksten en albumhoezen.

Google brengt AI-muziekmaker naar Gemini-app

Google integreert DeepMind's Lyria 3 in de Gemini-app, waarmee gebruikers nu 30-seconde muziekfragmenten kunnen genereren vanuit tekst, afbeeldingen en video's.