AI-gegenereerde code vormt groot risico voor software supply chain

In het kort:

Een grootschalig onderzoek naar AI-gegenereerde code toont aan dat bijna 20% van alle package-verwijzingen niet bestaat. Deze bevinding vormt een ernstig beveiligingsrisico voor software-ontwikkeling.

Van de 2,23 miljoen package-verwijzingen in 576.000 code samples waren er 440.445 niet-bestaand
Open source AI-modellen hallucinereren het meest, met 22% niet-bestaande verwijzingen
43% van de gehallucineerde packages werd meer dan 10 keer herhaald, wat aanvallers kunnen uitbuiten

Het grote plaatje:

De ontdekking is extra zorgwekkend omdat Microsoft voorspelt dat binnen vijf jaar 95% van alle code door AI zal worden gegenereerd. Kwaadwillenden kunnen misbruik maken van deze situatie door malware te publiceren onder de namen van niet-bestaande packages.

De onderste regel:

Het onderzoek toont duidelijke verschillen tussen verschillende AI-modellen en programmeertalen. Commerciële modellen presteren aanzienlijk beter dan open source alternatieven, met slechts 5% hallucinaties tegenover 22%. JavaScript-code is met 21% hallucinaties gevoeliger voor het probleem dan Python met 16%.

AI-gegenereerde code vormt groot risico voor software supply chain

Onderzoek onthult dat AI-modellen massaal verwijzen naar niet-bestaande softwarebibliotheken, wat de deur opent voor kwaadwillenden om malware te verspreiden via nepversies van deze 'gehallucineerde' packages.

In het kort:

Het grote plaatje:

De onderste regel:

Bronnen

Het belangrijkste nieuws gratis in je mailbox

Bekijk ook

AI-modellen creëren veiligheidsrisico's door niet-bestaande code-libraries

Onderzoek onthult dat AI-gegenereerde code vaak verwijst naar niet-bestaande software-bibliotheken, wat een ernstig beveiligingsrisico vormt voor de software-industrie.