Stability AI Introducerer Ny Lydgenerator
Stability AI, startuppen bag den AI-drevne kunstgenerator Stable Diffusion, har netop frigivet en åben AI-model til generering af lyde og sange. Modellen, der er døbt Stable Audio Open, er trænet udelukkende på royalty-frie optagelser.
Tekst Til Lyd På 47 Sekunder
Med Stable Audio Open kan brugere skrive en tekstbeskrivelse (fx “Rock beat spillet i et behandlet studie, sessionstrommer på et akustisk sæt”) og få en lydoptagelse på op til 47 sekunder leveret. Modellen er trænet på omkring 486.000 samples fra gratis musikbiblioteker som Freesound og Free Music Archive.
Til Kreativ Brug (Men Ikke Til Karaoke)
Stability AI siger, at modellen kan bruges til at skabe trommeslag, instrumentale riffs, omgivelseslyde og “produktions-elementer” til videoer, film og tv-shows. Den kan endda “redigere” eksisterende sange eller anvende stilen fra én sang (fx smooth jazz) til en anden.
Men der er en hage. Stable Audio Open kan ikke producere fulde sange, melodier eller vokaler — i hvert fald ikke gode nogen. Stability AI erkender selv, at modellen ikke er optimeret til dette og anbefaler i stedet deres betalte Stable Audio-service til de, som har disse behov.
Begrænsninger Og Bias
Modellen kan ikke bruges kommercielt, da dens betingelser forbyder det. Desuden performer den ikke lige godt på tværs af musikalske stilarter og kulturer eller med beskrivelser på andre sprog end engelsk. Ifølge Stability AI skyldes det træningsdataens bias.
“Kilden til data er potentielt mangler mangfoldighed, og ikke alle kulturer er lige repræsenteret i datasættet,” skrev Stability AI i en beskrivelse af modellen. “De genererede samples fra modellen vil afspejle bias fra træningsdataene.”
Kritik Og Kontroverser
Stability AI — der længe har kæmpet for at vende deres vaklende forretning — blev for nylig centrum for en kontrovers, efter at deres VP for generativ audio, Ed Newton-Rex, trak sig på grund af uenigheder om virksomhedens holdning til, at træning af generative AI-modeller på ophavsretligt beskyttede værker udgør “fair use”. Stable Audio Open kunne ses som et forsøg på at vende denne fortælling, mens de samtidig diskret reklamerer for deres betalbare produkter.
Som musikgeneratorer, herunder Stability’s, vinder i popularitet, bliver ophavsret – og måderne, hvorpå nogle skabere af generatorer muligvis misbruger det – et centralt fokusområde.
I maj sendte Sony Music, der repræsenterer kunstnere som Billy Joel, Doja Cat og Lil Nas X, et brev til 700 AI-virksomheder og advarede mod “uautoriseret brug” af deres indhold til træning af lydgeneratorer. Og i marts blev USA’s første lov, der sigter mod at dæmme op for misbrug af AI i musik, underskrevet i Tennessee.