AI’s Akilleshæl: En Båd, En Ged og En Kål
I den digitale æra, hvor AI modeller som GPT-4o udfører komplekse opgaver med lethed, står de over for noget så simpelt som en gåde, autocamperens krydsning af en flod, som viser sig at være en næsten ustoppelig udfordring. Skønt disse AI’er kan forføre os med deres sprogkundskaber, når det kommer til basal logik og problemløsning, falder de ofte igennem.
Hinton vs. LeCun: AI’s Intelligens på Vippen
Geoffrey Hinton, ofte omtalt som AIs gudfar, fremsætter en banebrydende påstand om, at vi måske snart vil se maskiner, der er mere intelligente end mennesker. I den anden lejr har vi Meta’s Yann LeCun, som argumenterer for, at selv “hunde-niveau” intelligens er langt væk i AI-verdenen. Spørgsmålet forbliver: Hvem har ret?
Praktiske Prøvelser: Flodkrydsningsgåden
Et klassisk eksempel, der overrasker mange, er den velkendte flodkrydsningsgåde, hvor en bonde skal transportere en ulv, en ged og et kålhoved over en flod uden at forårsage et rovdyr-bytte scenario. Selvom denne opgave lyder simpel, falder avancerede sprogmodeller som GPT-4o fladt på maven, når de tages ud af deres træningskontekst og præsenteres for en ny vinkel på problemet.
Meta og Anthropic på Vippebrættet: Kan Claude Sonnet 3.5 Gøre Det Bedre?
Trods store forventninger falder også Anthropic’s nyeste model, Claude Sonnet 3.5, igennem i forsøget på at løse en simplificeret version af flodkrydsningsgåden, sat op af professor sir William Timothy Gowers. Selvom teorien hævder fremskridt, viser praksis, at disse systemer stadig mangler fundamental forståelse for verdens mekanikker.
Er LLM’er Virkelig Bare Fancy Regnemaskiner?
Denne type gåder bringer en interessant pointe på bordet. Mens en AI som GPT-4o kan give indtryk af at “forstå” og “resonnere” via sin imponerende performans i standardiserede test som LSAT, viser de praktiske tests noget helt andet. Yann LeCun selv påpeger mangel på sund fornuft og evnen til planlægning som kritiske mangler. Så næste gang du læser om en AI, der bestod en juridisk eksamen, husk på, at den måske blot regurgiterer velkendt data snarere end at fremvise ægte intelligens.