Daily Shaarli
January 11, 2025
Meta Secretly Trained Its AI on a Notorious Piracy Database, Newly Unredacted Court Docs Reveal | WIRED
Meta aurait utilisé des livres et articles scientifiques en provenance de Library Genesis, une plateforme de contenu pirate, pour entraîner ses modèles d'IA.
Les données auraient été téléchargé en torrent, comme au bon vieux de temps de The Pirate Bay.
Cela relance le débat sur la légitimité des LLMs vis-à-vis de leur entrainement sur du contenu sous droit d'auteur.