Dagens AI
  • Nyheder
  • Danmark
  • Artikler
  • AI kunst
  • AI Chat
Reading: OpenAI klassificerer GPT-4o som ‘medium’ risiko for påvirkning
NYHEDSBREV
Dagens AIDagens AI
  • Nyheder
  • Danmark
  • Artikler
  • AI kunst
  • AI Chat
Søg
  • Nyheder
  • Danmark
  • Artikler
  • AI kunst
  • AI Chat
Har du en konto? Log ind
Follow US
© DagensAI. Alle Rettigheder Forbeholdes.
Dagens AI > Nyheder > OpenAI klassificerer GPT-4o som ‘medium’ risiko for påvirkning
Nyheder

OpenAI klassificerer GPT-4o som ‘medium’ risiko for påvirkning

Senest opdateret: 9. august 2024 6:07
DagensAI
2 Min Læsning
Del
Del

OpenAI vurderer GPT-4o som ‘medium’ risiko

OpenAI har klassificeret deres nyeste AI-model, GPT-4o, som ‘medium’ risiko i deres interne sikkerhedsramme. Denne vurdering er baseret på evalueringer fra både interne og eksterne teams, inklusive red teaming og testning af eksterne eksperter inden for områder som socialpsykologi, bias og misinformation.

Indhold
OpenAI vurderer GPT-4o som ‘medium’ risikoRisici ved persuasionEvaluering af forskellige kategorierForanstaltninger for risikoreduktionEkstern feedback og red teamingBegrænset udrulning

Risici ved persuasion

GPT-4o vurderes specielt at have ‘medium’ risiko inden for persuasion. Forskere fandt ud af, at modellens skriftsamples har en højere potentiale til at påvirke læsernes meninger sammenlignet med menneskeskabt tekst, selvom dens overordnede overtalelsesevne ikke er overlegen.

Evaluering af forskellige kategorier

OpenAI’s evalueringsramme inkluderer kategorier som cybersikkerhed, biologiske trusler, persuasion og modelautonomi. Størstedelen af disse kategorier blev vurderet som ‘lav’ risiko, med undtagelse af persuasion.

Foranstaltninger for risikoreduktion

OpenAI har implementeret forskellige sikkerhedsforanstaltninger, herunder filtrering af træningsdata og finjustering af modellens adfærd efter træning. De har også gennemført automatiserede og menneskelige evalueringer gennem hele træningsprocessen.

Google lancerer AI-værktøj for enklere tekster i iOS-app
7. maj 2025
Dansk AI-samarbejde vil forbedre medicin og opdage bivirkninger
12. maj 2025

Ekstern feedback og red teaming

Modellen har gennemgået omfattende ekstern red teaming med over 70 eksperter fra forskellige domæner for at identificere risici og forbedre sikkerhedsforanstaltningerne.

Begrænset udrulning

Den indledende udrulning af GPT-4o inkluderer tekst- og billedkapaciteter, med udvidede lyd- og videotjenester, der vil blive frigivet til betroede partnere i de kommende uger.

OpenAI’s beslutning om at frigive GPT-4o systemkortet, der beskriver sikkerhedsprotokoller og risikovurderinger, ses som et skridt mod større gennemsigtighed i udviklingen og implementeringen af avancerede AI-modeller, i en tid med stigende bekymringer over deres potentielle risici og indvirkninger.

TAGGED:AINyhederOpenAI
Del denne artikel
Facebook Email Copy Link Print
Forrige Artikel Palantir og Microsoft indgår partnerskab om AI i national sikkerhed
Næste Artikel AI kunst: Tidens Grene
Ingen kommentarer Ingen kommentarer

Skriv et svar Annuller svar

Du skal være logget ind for at skrive en kommentar.

200FollowersLike
300FollowersFollow
1kFollowersPin
- Annonce-
Japanske Plakater

Relaterede AI Artikler

Nyheder

UAE præsenterer ny AI-model for at konkurrere med store tech-giganter

UAE træder ind på den store AI-scene I et dristigt…

2 Min Læsning
AI kunst

AI kunst: Farverigt glasmosaik med mytologiske figurer

Komposition og Tema Billedet fremviser en vitrail (glasmosaik eller glasmaleri),…

2 Min Læsning
AI kunst

AI kunst: Fremtidens natur i symbiose med teknologi

Robotik og Natur I forgrunden ser vi en intrikat designet…

2 Min Læsning
Nyheder

AI afslører millioner af døde træer inden Californiens historiske skovbrande i 2020.

AI afslører millioner af skjulte døde træer før Californiens historiske…

3 Min Læsning
Dagens AIDagens AI
Follow US
© DagensAI. Danske AI nyheder.
  • Privatlivspolitik
  • Kontakt
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?