AI Overgår Mennesker i Mentaltest: Er Vi Klar Til Maskinernes Næste Trin?
Kunstig intelligens overhaler mennesker indenfor Theory of Mind-test, ifølge en ny undersøgelse. De store sprogmodeller (LLM), der driver ChatGPT og lignende, viser imponerende evner til at efterligne forståelsen af mentale tilstande – et område, mange forskere ikke troede var muligt for maskiner.
“Før vi udførte studiet, var vi overbeviste om, at store sprogmodeller ikke ville bestå disse tests,” siger professor Cristina Becchio fra University Medical Center Hamburg-Eppendorf. Resultaterne, som hun kalder “uventede og overraskende,” blev offentliggjort i tidsskriftet Nature Human Behavior i dag.
Resultaterne og Reaktionerne
Ikke alle er overbeviste om, at vi har taget et stort skridt mod maskiner, der tænker som mennesker. Eksperter advarer om at tage resultaterne med et “gran salt” og om farerne ved at tilskrive menneskelige træk til softwareprogrammer.
Forskerne testede 1907 mennesker sammenlignet med flere populære LLM’er, inklusiv OpenAI’s GPT-4 og Metas Llama 2-70b. Testene dækkede emner som at forstå hints, ironi og falske opfattelser. Interessant nok viste GPT-4 sig at have forbedret ydeevne på de fleste områder, dog med en undtagelse ved “faux pas” opgaver.
Hvordan Testede de det?
LLM’erne og menneskene gennemførte fem typer af Theory of Mind-opgaver. Fra ironiske kommentarer til komplekse spørgsmål om “mærkelige historier” med manipulation og misforståelser. GPT-4 matchede menneskers præstation i de fleste tests, men havde problemer når det kom til faux pas, muligvis pga. “hyperkonservative” programmeringsgrænser ifølge forsker James Strachan.
Kritik af Studiet
Nogle forskere, som Yoav Goldberg og Natalie Shapira, der tidligere har kritiseret lignende studier, er fortsat skeptiske. De mener, at modellerne kunne have memoriseret de korrekte svar under deres træning. Emily Bender fra University of Washington går endnu længere og påpeger farerne ved at menneskeliggøre AI-systemer og spørger: “Hvad lærer det os faktisk om LLM’ernes interne funktioner?”
Hvad Betyder Det for Fremtiden?
Selvom resultaterne ikke nødvendigvis betyder, at AI “forstår” os på samme måde som mennesker, er konsekvenserne værd at overveje. AI, der overbevisende efterligner menneskelig tankegang, kan blive bedre til at interagere med og forudsige brugernes behov – men også til at manipulere dem.
Der er uden tvivl flere overraskelser i vente, når vi udforsker det komplicerede samspil mellem menneskelig forståelse og kunstig intelligens. Velkommen til det næste skridt i maskinernes evolution – spænd sikkerhedsbæltet!