Daily - January 5, 2025 - Aschen | Sharing the webz

Delete Set public Set private

Daily Weekly Monthly

Daily Shaarli

All links of one day in a single page.

January 5, 2025

ChainForge: A visual programming environment for prompt engineering

Un outil no-code pour évaluer des prompts.

On retrouve tous les évaluateurs habituels: code, LLM as a judge, etc

L'outil est Open Source et tourne en local si besoin

c-ai prompt-engineering

Things we learned about LLMs in 2024

Le meilleur résumé de l'année 2024 en GenAI

les modèles du niveau de GPT-4 sont légions
le coût des tokens a été divisé par 10
les modèles multi-modaux sont monnaie courante
la génération de code fonctionne très très bien
les agents autonomes peinent à sortir
le début des modèles de "raisonnement" comme o1
les données synthétique pour l'entrainement se développent

Hâte de voir ce que 2025 nous réserve !

c-ai