In het kort:
Onderzoekers van Stanford, Cornell en West Virginia University hebben ontdekt dat AI-modellen veel meer tekst letterlijk kopiëren dan gedacht. Meta's nieuwste model Llama 3.1 70B spant hierbij de kroon.
- Het model kan bijna de helft van 'Harry Potter and the Sorcerer's Stone' reproduceren
- Dit percentage is tien keer hoger dan bij het vorige Llama-model uit 2023
- Bij minder populaire boeken ligt het percentage veel lager, rond de 0,1 procent
Het grote plaatje:
Deze bevindingen kunnen verstrekkende gevolgen hebben voor rechtszaken over auteursrecht in AI. Het ondermijnt het argument van AI-bedrijven dat hun modellen alleen 'leren' van teksten zonder ze te kopiëren.
- De resultaten verschillen sterk per boek, wat klassikale rechtszaken kan bemoeilijken
- Populaire boeken worden veel vaker gememoriseerd dan obscure titels
- Open source modellen zijn kwetsbaarder voor deze claims dan gesloten systemen
De andere kant:
Het onderzoek roept vragen op over de toekomst van open AI-modellen. Bedrijven zouden kunnen besluiten hun modellen niet meer openbaar te maken om rechtszaken te voorkomen, wat innovatie en transparantie in de sector zou kunnen schaden.