AI Skandale: Tech-giganter Brugte YouTube Videoer Uden Tilladelse!
Flere store teknologivirksomheder, herunder Apple og Anthropic, er blevet afsløret i at bruge YouTube-videoer uden tilladelse til at træne deres kunstige intelligens (AI) modeller. Denne praksis involverer udnyttelse af et datasæt med over 170.000 YouTube videotekster, kendt som The Pile, som er samlet af EleutherAI, hvilket rejser spørgsmål om brud på ophavsretten og mulige overtrædelser af YouTubes tjenestevilkår.
Fremtrædende Virksomheder På Listen
Ud over Apple og Anthropic er virksomheder som Nvidia, Salesforce, Bloomberg og Databricks også identificeret som brugere af The Pile til AI modeltræning. Dette komplekse datasæt består af transskriptioner fra næsten 175.000 YouTube-videoer på cirka 48.000 kanaler, herunder kendte skabere som MrBeast og Marques Brownlee, samt uddannelsesinstitutioner som MIT og Harvard.
Indhold Af The Pile
Datasættet indeholder en blanding af populære kanaler, nyhedsorganisationer som ABC News, BBC og The New York Times, uddannelsesindhold, late-night shows og endda ophavsretsbeskyttede musikvideoer. Dette har naturligvis bragt juridiske spørgsmål til overfladen, idet YouTubes tjenestevilkår specifikt forbyder uautoriseret scraping af videoer og data.
Virksomhedernes Reaktioner
Marques Brownlee har udtrykt bekymring over, at tech-giganter bruger scrappet data til AI-træning, og understreger de etiske konsekvenser og den potentielle økonomiske påvirkning for skaberne. Anthropic hævder, at deres brug af The Pile overholder reguleringer, og skelner mellem direkte platformbrug og datasætsudnyttelse. Apple og Salesforce har anerkendt brugen af The Pile, men har ikke givet detaljerede svar.
Offentlig Reaktion Og Nye Værktøjer
For at kaste lys over disse praksisser har Proof News lanceret et interaktivt værktøj, som gør det muligt for brugere at søge og identificere, om specifikke videoer eller kanaler er inkluderet i YouTubes AI-træningsdatasæt. Dette værktøj fremhæver yderligere betydningen af transparens i AI-udviklingen og den fortsatte debat om dataetik.
Mens denne praksis med at bruge uautoriserede videodata bliver stadig mere almindelig, er det en påmindelse om vigtigheden af regulering og etiske standarder i en verden, hvor AI udvikles med rekordfart.