Weekly - Week 49 (December 2, 2024) - Aschen

Weekly Shaarli

All links of one week in a single page.

Week 49 (December 2, 2024)

I spent 8 hours testing o1 Pro ($200) vs Claude Sonnet 3.5 ($20) - Here's what nobody tells you about the real-world performance difference : ChatGPT

Un retour d'expérience sur l'utilisation de o1 et Claude 3.5 Sonnet.

La conclusion c'est que dans la majorité des cas, Claude 3.5 Sonnet est suffisamment bon et que la différence prix + latence entre les deux modèles fait plutôt pencher la balance du côté de Claude 3.5 Sonnet

c-ai text-ai

OpenAI réfléchit à sa stratégie pour ajouter la publicité à son modèle économique

Tout est dans le titre.

OpenAI recrute des spécialistes de la publicité en provenance de chez Google et Meta pour réfléchir à son offre publicitaire.

À priori, ça sera sûrement du placement de produit dans les résultats de génération de ChatGPT.

Un article proposait une méthode pour transposer le système d'enchères traditionnel de la pub en ligne aux LLM

c-ai text-ai

We had Image Gen copying LLM... and now the REVERSE?? [DiffusionLM]

Une percée potentielle dans l'architecture des LLMs !

L'architecture actuelle (ARM) est une génération "de gauche à droite" ou l'on génère les tokens les un après les autres en concaténant les tokens générés pour faire le nouveau prompt.

En s'inspirant des modèles de diffusion d'image, les chercheurs ont mis au point une nouvelle architecture de modèle (MDM) qui génère les tokens avant et après le prompt.

Ces modèles sont plus cher à entrainer mais ils présentent plusieurs avantages:

meilleures performances de génération sur des problèmes standards
capable "d'apprendre" et d'inférer que si A = B alors B = A (les LLMs ont beaucoup de mal à ça)
jusqu'à 40% plus rapide

C'est un tout nouveau champ de recherche qui commence à prendre de l'ampleur !

Finalement on dirait qu'on a pas encore atteint ce fameux plafond de verre ;-)

c-ai text-ai