I en verden, hvor internettet ikke kan få fred, har Meta, selskabet bag Facebook, Instagram og Whatsapp, nu introduceret en ny web scraper bot, der har til opgave at opsluge al tilgængelig data for at fodre sine AI-modeller.
Meta’s hemmelige mission
Den nyeste tilføjelse til Metas teknologiske arsenal, Meta External Agent, blev lanceret stille og roligt sidste måned. Denne automatiske bot snupper diskret alt fra tekst i nyhedsartikler til samtaler i online fora. Det er i sandhed en digital gourmand, der samler ind til AI-træning.
En klynk af GDPR-brud?
Meta’s seneste indsamlingseventyr har efterladt mange med en pixelpræget panderynken. Er det egentlig helt i orden? Bøsserne fra Dark Visitors, der hjælper websteder med at undgå disse digitale støvsugere, siger at Meta External Agent har rystet nettet lige så meget som OpenAI’s GPTBot.
Robotten der sagde “nej tak”
Mens 25% af verdens mest populære hjemmesider allerede har markeret “ingen adgang” til GPTBot, er kun 2% af samme holdning overfor Meta’s glubske nye følgesvend. Tja, “doorbell ditching tactics” ser ud til at være en nødvendig færdighed for website-ejere, der ikke ønsker at fodre det store AI-bæst.
Lovens lange arm?
Selvom det kræver lidt talent for kode at blokere disse scrapers, er det ikke umuligt. Et simpelt robots.txt signalerer nødvendigt, men det er lige så bindende som en “venligst ikke forstyrr”-skilt i et travlt kontorlandskab. Det står skraber operatøren frit for enten at respektere eller fuldstændigt ignorere anmodningen.
Meta’s datadrevne diæt
Meta’s Llama, en af de største LLMs, har brug for konstant opdatering med friske og kvalitetsrige data. Det tyder på, at Metas eksisterende skatte af data ikke længere er tilstrækkelige, selvom Mark Zuckerberg har pralede af et massivt datavalg. Den glubske appetit på fremtidig indlæring kræver mere!
Mens Meta sigter mod at bruge milliarder i 2023 på AI-infrastruktur, må vi nok finde os i, at internettets sandkasse aldrig rigtig vil være urørt igen. Skål for fremtiden, hvor også web scrapers nu har fået sit eget webskraber-til-webskraber-kursus i charme!