Cool eller creepy? Microsofts nyeste trick
Forestil dig et fremtidsscenario, hvor du kan uploade et billede og en lydfil af dig selv, og vupti – ud kommer en levende, talende version af dit ansigt, der mimikerer hver lyd til perfektion. Microsofts seneste AI-geni, VASA-1, lover netop dette. Er det ikke lidt som at træde ind i en sci-fi film?
Magien bag VASA-1
Denne teknologiske troldmand tager et enkelt portrætfoto sammen med en lydfil og forvandler dem til en hyperrealistisk video af et talende ansigt. Glem alt om stive CGI-karakterer; her får du læbesynkronisering, livagtige ansigtstræk og hovedbevægelser, der ville gøre enhver digital influencer grøn af misundelse. Selvom VASA-1 stadig er på forsøgsstadiet, har demo-videoerne allerede fået nettet til at summere af begejstring.
Overlegen teknologi
I modsætning til eksisterende teknologier fra virksomheder som Runway og Nvidia, praler VASA-1 med en kvalitet og realisme, der formindsker mundartefakter betydeligt. Og hvis du troede, det lyder bekendt, så ligner det Google Researchs nylige VLOGGER AI-model – men med Musketerernes ed, dette er et skridt videre.
Den uventede rækkevidde
Og hold nu fast; man behøver ikke engang et frontalt ansigtsfoto. VASA-1 kan arbejde med billeder taget fra forskellige vinkler og tilbyder en imponerende kontrol over øjenretning, hovedafstand og endda følelser! Hvem havde troet, at AI kunne blive følelsesladet?
Hvorfor VASA-1?
Udover den åbenlyse “fordi vi kan”-faktor, forestil dig potentialet i avanceret læbesynkronisering til spil, hvor AI-drevne NPC’er kan snakke naturligt, eller skabelsen af virtuelle avatars til sociale medievideoer, der ikke ligner noget fra en dårlig 90’er-tegnefilm.
Men virker det?
Forskerne bag VASA-1 blev blæst bagover af dets evne til perfekt at læbesynkronisere til sange, reflektere ordene præcist som en rigtig sanger – alt sammen uden musik i træningssættet. Og ja, de fik det endda til at arbejde med Mona Lisa. Forestil dig Leonardo da Vinci’s reaktion!
En fremtid fuld af muligheder
Til trods for at VASA-1 stadig er i sin barndom, og Microsoft holder det tæt ind til kroppen, kan vi ikke hjælpe med at drømme om fremtiden. Dette værktøj har potentialet til at revolutionere digitalt indhold på måder, vi kun lige har begyndt at forestille os. Så hvem ved? Måske vil din næste TikTok-video faktisk være med en AI-version af dig selv, der rapper til dit yndlingsspor. Velkommen til fremtiden – den er både cool og en smule creepy.