1341 shaares
Meta aurait utilisé des livres et articles scientifiques en provenance de Library Genesis, une plateforme de contenu pirate, pour entraîner ses modèles d'IA.
Les données auraient été téléchargé en torrent, comme au bon vieux de temps de The Pirate Bay.
Cela relance le débat sur la légitimité des LLMs vis-à-vis de leur entrainement sur du contenu sous droit d'auteur.