Kyutais AI-taleassistent slår OpenAI til offentliggørelse

Fransk AI-lab Stjæler Rampelyset fra OpenAI

Mens vi stadig tålmodigt venter på, at OpenAI frigiver deres GPT-4o stemmeassistent, har et fransk non-profit AI-laboratorium, Kyutai, slået dem til stregen. De har netop lanceret Moshi, en realtidsstemmeassistent, der bygger på Helium 7B-modellen. Denne model er udviklet og trænet med både syntetisk tekst og lyddata, fintunet med syntetiske dialoger for at lære interaktion.

Indhold

Fransk AI-lab Stjæler Rampelyset fra OpenAI
Moshis Evner Taler For Sig Selv
Realistisk og Interaktiv Sci-fi Rollespil Under præsentationen gav Kyutai en smagsprøve på Moshi, hvor den deltager i et sci-fi rollespil. Moshis figurevrne og interaktive stil mindede deltagerne om, at vi nærmer os en æra, hvor teknologi bliver mere menneskelig. Smidig Teknologi Til Hjemmebrug
Perspektiver og Potentiale

Moshis Evner Taler For Sig Selv

Moshi kan forstå og udtrykke hele 70 forskellige følelser, tale i forskellige stilarter og accentere. Demoen af dens imponerende end-to-end latency på kun 200 millisekunder fik virkelig publikum til at måbe. Ved at lytte, tænke og tale samtidigt gør Moshi interaktionerne glatte uden akavede pauser.

Realistisk og Interaktiv Sci-fi Rollespil

Trods sin lille størrelse sammenlignet med GPT-4o, betyder Helium 7B’s kompakte natur, at den kan køres på almindelig forbrugerelektronik eller i skyen med lavenergi GPU’er. En Kyutai-ingeniør demonstrerede dette ved at køre Moshi på en MacBook Pro.

Perspektiver og Potentiale

Selvom Moshi stadig er en eksperimentel prototype, og hjemmesideversionen kører lidt ustabilt på grund af høj efterspørgsel, så påpeger Kyutai, at de kommer til at frigive modellen, kodeken, koden og vægtene snart. Det giver håb om, at ydeevnen snart vil kunne matche det, man så i demoen.

To mænd i jakkesæt sidder over for hinanden ved et konferencebord i et moderne kontor med et verdenskort på væggen bag dem. Den ene mand gestikulerer, mens den anden lytter. - Kunstig intelligens AI

Kina opfordrer USA til at lette AI-chip eksportkontrol

10. august 2025

Et nærbillede af orange gnister og glødende partikler, der stiger op fra en bunke pulver eller sand på en mørk overflade og skaber en dramatisk, brændende effekt med røg i baggrunden. - Kunstig intelligens AI

AI afslører nye fysikfænomener i støvet plasma

9. august 2025

Så selvom Moshi måske har sine barnesygdomme, viser denne førstefødselsret over for OpenAI, at en lille tropp af dedikerede ingeniører kan udrette store ting – og får os til at spørge: “Hvorfor venter vi stadig på, at GPT-4o skal tale til os?” Besøg https://kyutai.org/ for selv at opleve Moshi.

Kyutais AI-taleassistent slår OpenAI til offentliggørelse

Fransk AI-lab Stjæler Rampelyset fra OpenAI

Moshis Evner Taler For Sig Selv

Realistisk og Interaktiv Sci-fi Rollespil

Perspektiver og Potentiale

Kina opfordrer USA til at lette AI-chip eksportkontrol

AI afslører nye fysikfænomener i støvet plasma

Skriv et svar Annuller svar

Relaterede AI Artikler

Apple afbryder samtaler om investering i OpenAI ifølge Wall Street Journal.

AI skal sikre tryghed på Roskilde Festival

Google tester AI Mode-knap i stedet for held-knappen

AI kunst: Rumstation og planetær rejse