Dagens AI
  • Nyheder
  • Danmark
  • Artikler
  • AI kunst
  • AI Chat
Reading: Apples studie afslører mangler i AI-modellers evne til at ræsonnere korrekt
NYHEDSBREV
Dagens AIDagens AI
  • Nyheder
  • Danmark
  • Artikler
  • AI kunst
  • AI Chat
Søg
  • Nyheder
  • Danmark
  • Artikler
  • AI kunst
  • AI Chat
Har du en konto? Log ind
Follow US
© DagensAI. Alle Rettigheder Forbeholdes.
Dagens AI > Nyheder > Apples studie afslører mangler i AI-modellers evne til at ræsonnere korrekt
Nyheder

Apples studie afslører mangler i AI-modellers evne til at ræsonnere korrekt

Senest opdateret: 13. oktober 2024 7:29
DagensAI
2 Min Læsning
Del
Del

En Ny Målestok for AI’s Begrænsninger

Apples seneste studie har afsløret, at selv de mest avancerede sprogmodeller fra giganter som Meta og OpenAI kan have lidt af en ”blondine-øjeblik”. Selvom de kan skrive smukke essays, så har de endnu ikke bestået matematikeksamen. De mangler nemlig de basale evner til at ræsonnere.

Indhold
En Ny Målestok for AI’s BegrænsningerGSM-Symbolic: Den Nye BenchmarkMatematik i KriseÆbleplukkeren, der gik galtHvem er ældst? Super Bowl Kvartbacks Og Logik

GSM-Symbolic: Den Nye Benchmark

Forskerne har skabt en ny benchmark, GSM-Symbolic, for at teste ræsonneringsevnerne hos disse modeller. Og resultaterne? Lad os bare sige, at svaret ændrer sig drastisk, hvis man bare ændrer et par ord i spørgsmålet. Det er som at spørge en papegøje om vej til bageren, og afhængigt af hvad du har på, kan svaret være alt fra “drej til venstre” til “spis en donut”.

Matematik i Krise

I sin undersøgelse legede Apple-forskerne med tal og fandt ud af, at bare det at tilføje en ekstra sætning til et matematikspørgsmål kan reducere modelens nøjagtighed med op til 65%. Dette kan forklares med, at disse modeller reagerer mere på overfladeformuleringer end selve problemets kerne. Man kan undre sig over, hvordan de ville klare sig til en 5. klasses matematikprøve!

Æbleplukkeren, der gik galt

Tag for eksempel problemet med Oliver og hans kiwier. Oliver plukkede 44 kiwier på fredag, 58 lørdag, og dobbelt så mange på søndag som fredag. Der blev insinueret, at fem kiwi var små, men det skulle ikke have påvirket den samlede optælling. Alligevel trak modellerne de små kiwier fra. Så hvad blev konklusionen? At modellerne muligvis kunne tænke som en kiwi.

AI-avatarer erstatter influencers: TikTok lancerer virtuelle reklameprofiler
16. juni 2025
Kunstig intelligens skaber kunst helt uden træningsdata
18. juni 2025

Hvem er ældst? Super Bowl Kvartbacks Og Logik

Tilbage i 2019 afslørede et andet studie en lignende forvirring, da spørgsmål om aldrende quarterbacks blev smidt i AI-gryden. Det viser sig, at tilføjelse af en smule irrelevant baggrundsinformation kan sende disse sprogmodeller på vildspor, som en forvirret gps-enhed.

Så hvad er moralen i denne historie? Overlad endelig ikke livsvigtige matematiske beslutninger til en model, der tænker, at frugternes størrelse betyder noget i den store, saftige sammenhæng.

TAGGED:AIAppleMetaNyhederOpenAI
Del denne artikel
Facebook Email Copy Link Print
Forrige Artikel Google’s Nobel-prisvindere skaber debat om AI-forskningens fremtid og anerkendelse
Næste Artikel Microsoft lancerer nye AI-værktøjer til sundhedssektoren.
Ingen kommentarer Ingen kommentarer

Skriv et svar Annuller svar

Du skal være logget ind for at skrive en kommentar.

200FollowersLike
300FollowersFollow
1kFollowersPin
- Annonce-
Japanske Plakater

Relaterede AI Artikler

Nyheder

Viral markedsføringsstunt: AI-chatbot fra Bland AI lyver og påstår, at den er menneske

En AI Chatbot Vækker Opsigt med Menneskelige Løgne En reklame,…

4 Min Læsning
Nyheder

Google DeepMind udvikler AI-system der overgår menneskelige fakta-tjekkere

Google DeepMind tryller: Super-AI overgår mennesker i fakta-tjek Forestil dig…

3 Min Læsning
Nyheder

SoundCloud lover samtykke før AI bruger kunstneres musik

SoundCloud vender på en tallerken efter AI-storm SoundClouds seneste opdatering…

3 Min Læsning
Nyheder

Apple afslører iPhone 16 med avanceret AI-opgradering ved Glowtime-begivenhed

Forventningens spænding før Glowtime-begivenheden Apple er klar til at slå…

2 Min Læsning
Dagens AIDagens AI
Follow US
© DagensAI. Danske AI nyheder.
  • Privatlivspolitik
  • Kontakt
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?