Daily Shaarli

All links of one day in a single page.

February 8, 2024

Self-Rewarding Language Models
thumbnail

Des recherches sur un modèle capable de s'entrainer lui même en se fournissant du feedback à lui même.

Ça me fait penser à de l'apprentissage non-supervisé mais appliqué aux LLMs