En Ret Lang Tids Skattejagt Er Slut!
Den hollandske copyright-gruppe BREIN har trukket stikket på en kæmpe sprogdatamængde, der angiveligt skulle hjælpe med at træne AI-modeller. Ifølge organisationen indeholdt denne gigantiske skattekiste data uden tilladelse fra titusindvis af bøger, nyhedssider samt undertekster fra „utallige‟ film og TV-serier. Kort sagt, det var en ordentlig buffet af ulovlig data.
En Digital Detektivhistorie
BREIN slog til og afslørede det, der kunne være blevet en af de største ulovlige datamængder i AI-verdenen. Direktør Bastiaan van Ramshorst delte med Reuters, at det er uklart, om og hvor bredt denne datamængde allerede er blevet brugt af AI-firmaer. Han tilføjede med et smil: „Det er meget svært at vide, men vi prøver at være i tide for at undgå fremtidige retssager.‟
EU vs USA: AI Lovgivningens Landskab
Med den kommende EU’s AI-lov vil AI-firmaer blive tvunget til at oplyse, hvilke datasæt de har brugt til at træne deres modeller. Hen over Atlanten er Microsoft-støttede OpenAI blevet ramt af adskillige retssager, inklusive en fra The New York Times, der beskylder dem for at bruge ophavsretligt beskyttet materiale uden tilladelse.
Danmarks Eget Eventyr
Situationen minder om sidste års eventyr i Danmark, hvor ophavsretsgruppen Danish Rights Alliance tvang fjernelsen af det enorme datasæt „Books3‟. Måske troede nogen, de kunne spille forfattere i deres egen AI-inspirerede detektivhistorie?
Den Usynlige Skurk
Den person, der gjorde det hollandske datasæt tilgængeligt, har accepteret at standse og fjerne det fra websitet. BREIN har ikke afsløret denne persons identitet, med henvisning til hollandske privatlivsregler. Og således, den usynlige skurk forbliver uset – i hvert fald for nu.