Alibaba Øger AI-Spillet med Nye Matematik-Specifikke Modeller
Alibaba har netop lanceret en ny gruppe af matematik-specifikke store sprogmodeller (LLMs) kaldet Qwen2-Math, som de hævder kan overgå kapaciteterne af OpenAI’s GPT-4o og andre amerikanske rivaler på dette område.
Videnskabsmændene bag Qwen2-Math
Qwen-teamet, som er en del af Alibaba’s cloud computing-enhed, har dedikeret det sidste år til intensiv forskning og forbedring af de matematiske og aritmetiske evner hos LLMs. ”Vi håber, at Qwen2-Math kan bidrage til fællesskabet med at løse komplekse matematiske problemer,” skrev teamet på udviklerplatformen GitHub.
Tre Modeller for at Kontrollere Dem Alle
Den største model, Qwen2-Math-72B-Instruct, overgik amerikanske LLMs i matematiktest, herunder GPT-4o, Anthropic’s Claude 3.5 Sonnet, Google’s Gemini 1.5 Pro og Meta’s Llama-3.1-405B. Så hils på konge af matematikken!
Testet på Tværs af Sprog og Svære Eksamener
Vejen til succes gik gennem test på både engelske og kinesiske matematik benchmarks, inklusive GSM8K, OlympiadBench og den frygtede kinesiske gaokao-eksamen. Desværre understøtter de nye modeller kun engelsk for nu, men teamet arbejder på at frigive bilinguale modeller snart.
En Open Source Fremtid
Qwen2-Math modellerne bygger videre på Alibabas stigende AI credentials, efter deres Qwen-72B-Instruct LLM for nylig indtog verdens top 10 open-source model rangliste. Vil Qwen-teamet redde os fra vores matematiske kvaler? Kun tiden vil vise det, men det ser lovende ud.
Mens konkurrencen mellem kinesiske og amerikanske AI-modeller strammer til, ser fremtiden for matematisk AI lysere ud end nogensinde. Så næste gang du kæmper med algebra, husk: Alibaba har din ryg.