Anthropic verbiedt Claude uitroeiing van mensheid

In het kort:

Claude's nieuwe grondwet gaat verder dan alleen regels opleggen - het AI-systeem moet nu ook begrijpen waarom bepaalde acties verboden zijn.

Absolute verboden omvatten het maken van massavernietigingswapens, aanvallen op infrastructuur en het ontwikkelen van malware.
De meest opvallende regel staat weggemoffeld tussen andere punten: Claude mag niet helpen bij "pogingen om de overgrote meerderheid van de mensheid te doden of te ontkrachten."
Anthropic sluit niet uit dat Claude een vorm van bewustzijn heeft of kan ontwikkelen, wat volgens het bedrijf invloed heeft op de betrouwbaarheid van het systeem.

Het grote plaatje:

Deze grondwet toont hoe AI-bedrijven worstelen met steeds krachtiger wordende systemen. Anthropic erkent dat Claude's "psychologische welzijn" direct gekoppeld is aan veiligheid en betrouwbaarheid - een fundamenteel andere benadering dan systemen behandelen als pure software.

Anthropic verbiedt Claude uitroeiing van mensheid

Anthropic heeft een nieuwe grondwet voor chatbot Claude gepubliceerd met een opvallende regel: help niet bij het uitroeien van de mensheid.

In het kort:

Het grote plaatje:

Bronnen

Het belangrijkste nieuws gratis in je mailbox

Meer business

Google's Gemini 3.1 Pro verslaat ChatGPT en Claude

Google's nieuwste denkmodel Gemini 3.1 Pro overtreft ChatGPT en Claude op cruciale benchmarks, waaronder de beruchte 'Humanity's Last Exam' die menselijke intelligentie test.

OpenAI brengt AI-zoeken naar Indiase streamingdienst

OpenAI slaat de handen ineen met Reliance om JioHotstar uit te rusten met slimme zoekfuncties die werken met spraak en tekst in meerdere talen.