Weekly Shaarli

All links of one week in a single page.

Week 06 (February 5, 2024)

Self-Rewarding Language Models
thumbnail

Des recherches sur un modèle capable de s'entrainer lui même en se fournissant du feedback à lui même.

Ça me fait penser à de l'apprentissage non-supervisé mais appliqué aux LLMs