Stability AI lancerer Stable Diffusion 3: Den mest avancerede billedgenereringsmodel nogensinde
Stability AI har netop lanceret Stable Diffusion 3 Medium, som den britiske startup kalder deres “mest avancerede tekst-til-billede model til dato”. Og det bedste af det hele? Det kan køre på din helt almindelige forbrugersystem!
Fotorealistiske billeder – også på din hjemme-setup
Med sine to milliarder parametre lover SD3 Medium at skabe fotorealistiske resultater uden komplicerede arbejdsgange. Stability AI nævner, at modellen særlig udmærker sig ved at undgå de klassiske fejl som artefakter i hænder og ansigter. Så farvel til akavede hænder og skæve smil!
Kan forstå komplekse kommandoer og generere tekst med præcision
Stability AI har designet SD3 Medium til at forstå komplekse anmodninger om rumlige forhold, kompositoriske elementer, handlinger og stilarter. Typografien er også blevet forbedret, og firmaet beskriver tekstgenereringsnøjagtigheden som “uovertruffen”. Det hele skyldes den nye Diffusion Transformer-arkitektur.
Vender bølgen? Stabilitet i en turbulent tid
På trods af store fremskridt har Stability AI haft sin del af udfordringer. Siden firmaet blev grundlagt i 2020, har det været en stjerne i fremvæksten af generativ AI. Men lovsager fra kunstnere og finansielle udfordringer har skabt bølger. Kun sidste måned rapporterede The Information, at firmaet overvejede salg på grund af pengemangel. CEO og grundlægger Emad Mostaque trak sig i marts for at forfølge decentraliseret AI.
Fremtiden lover flere opgraderinger
Men det er ikke altsammen dystert. Bilder fra SD3 Medium viser, at modellen fortsætter med at imponere. Ifølge co-CEO Christian Laforte arbejder firmaet også på “multimodale indsatser inden for video, audio og sprog”. Så det er bestemt ikke sidste gang, vi hører fra denne ambitiøse startup.
Sådan kan du få fat i SD3 Medium
Brugere kan teste SD3 Medium gennem Stability’s API. Modelværdierne er tilgængelige under en åben ikke-kommerciel licens og en økonomisk overkommelig Creator License. For de, der ønsker storstilet kommerciel brug, er det blot at kontakte startup’en for de nødvendige licensoplysninger.