Logo van Ars Technica

-Onderzoek

Meta's AI-model blijkt grote delen Harry Potter te hebben gememoriseerd

Copyright arstechnica
Foto: VandaagAI.nl

Nieuw onderzoek toont aan dat Meta's taalmodel Llama 3.1 maar liefst 42 procent van het eerste Harry Potter-boek kan reproduceren, wat grote gevolgen kan hebben voor lopende rechtszaken over auteursrecht.

In het kort:

Onderzoekers van Stanford, Cornell en West Virginia University hebben ontdekt dat AI-modellen veel meer tekst letterlijk kopiëren dan gedacht. Meta's nieuwste model Llama 3.1 70B spant hierbij de kroon.

  • Het model kan bijna de helft van 'Harry Potter and the Sorcerer's Stone' reproduceren
  • Dit percentage is tien keer hoger dan bij het vorige Llama-model uit 2023
  • Bij minder populaire boeken ligt het percentage veel lager, rond de 0,1 procent

Het grote plaatje:

Deze bevindingen kunnen verstrekkende gevolgen hebben voor rechtszaken over auteursrecht in AI. Het ondermijnt het argument van AI-bedrijven dat hun modellen alleen 'leren' van teksten zonder ze te kopiëren.

  • De resultaten verschillen sterk per boek, wat klassikale rechtszaken kan bemoeilijken
  • Populaire boeken worden veel vaker gememoriseerd dan obscure titels
  • Open source modellen zijn kwetsbaarder voor deze claims dan gesloten systemen

De andere kant:

Het onderzoek roept vragen op over de toekomst van open AI-modellen. Bedrijven zouden kunnen besluiten hun modellen niet meer openbaar te maken om rechtszaken te voorkomen, wat innovatie en transparantie in de sector zou kunnen schaden.

Bronnen

Het belangrijkste nieuws gratis in je mailbox

Elke week een korte e-mail met de meest relevante verhalen.

Meer onderzoek