OpenAI klassificerer GPT-4o som 'medium' risiko for påvirkning

OpenAI vurderer GPT-4o som ‘medium’ risiko

OpenAI har klassificeret deres nyeste AI-model, GPT-4o, som ‘medium’ risiko i deres interne sikkerhedsramme. Denne vurdering er baseret på evalueringer fra både interne og eksterne teams, inklusive red teaming og testning af eksterne eksperter inden for områder som socialpsykologi, bias og misinformation.

Indhold

OpenAI vurderer GPT-4o som ‘medium’ risiko
Risici ved persuasion
Evaluering af forskellige kategorier
Foranstaltninger for risikoreduktion
Ekstern feedback og red teaming
Begrænset udrulning

Risici ved persuasion

GPT-4o vurderes specielt at have ‘medium’ risiko inden for persuasion. Forskere fandt ud af, at modellens skriftsamples har en højere potentiale til at påvirke læsernes meninger sammenlignet med menneskeskabt tekst, selvom dens overordnede overtalelsesevne ikke er overlegen.

Evaluering af forskellige kategorier

OpenAI’s evalueringsramme inkluderer kategorier som cybersikkerhed, biologiske trusler, persuasion og modelautonomi. Størstedelen af disse kategorier blev vurderet som ‘lav’ risiko, med undtagelse af persuasion.

Foranstaltninger for risikoreduktion

OpenAI har implementeret forskellige sikkerhedsforanstaltninger, herunder filtrering af træningsdata og finjustering af modellens adfærd efter træning. De har også gennemført automatiserede og menneskelige evalueringer gennem hele træningsprocessen.

AI ændrer spillereglerne for SEO-indsatsen

19. august 2025

Abstrakt digital illustration af et stærkt lysudbrud i midten med blå og orange stråler, der stråler udad mod en mørk gitterbaggrund, og små glødende partikler spredt rundt omkring. - Kunstig intelligens AI

Meta omstrukturerer AI-division igen for at fremme superintelligens

16. august 2025

Ekstern feedback og red teaming

Modellen har gennemgået omfattende ekstern red teaming med over 70 eksperter fra forskellige domæner for at identificere risici og forbedre sikkerhedsforanstaltningerne.

Begrænset udrulning

Den indledende udrulning af GPT-4o inkluderer tekst- og billedkapaciteter, med udvidede lyd- og videotjenester, der vil blive frigivet til betroede partnere i de kommende uger.

OpenAI’s beslutning om at frigive GPT-4o systemkortet, der beskriver sikkerhedsprotokoller og risikovurderinger, ses som et skridt mod større gennemsigtighed i udviklingen og implementeringen af avancerede AI-modeller, i en tid med stigende bekymringer over deres potentielle risici og indvirkninger.

OpenAI klassificerer GPT-4o som ‘medium’ risiko for påvirkning

OpenAI vurderer GPT-4o som ‘medium’ risiko

Risici ved persuasion

Evaluering af forskellige kategorier

Foranstaltninger for risikoreduktion

AI ændrer spillereglerne for SEO-indsatsen

Meta omstrukturerer AI-division igen for at fremme superintelligens

Ekstern feedback og red teaming

Begrænset udrulning

Skriv et svar Annuller svar

Relaterede AI Artikler

Interview med Cinderella Amar: Fremtiden for Web4, AI og Blockchain

Taco Bell udruller stemme-AI til hundredevis af drive-thru steder i år

Perplexity lancerer AI-browser – udfordrer Google på søgemarkedet

Microsoft udnævner ny strategi-chef til at lede AI-revolutionen