Weekly Shaarli

All links of one week in a single page.

Week 37 (September 9, 2024)

Supercharge your browser extension development – Plasmo
thumbnail

Un framework pour développer des extensions navigateur

LTM-2-mini - 100M Token Context Windows
thumbnail

Un modèle supportant une fenêtre de contexte de 100M de tokens.

L'avancée c'est surtout une réduction drastique de la mémoire nécessaire, LlaMa 3.1 405B aurait besoin de 638 H100 pour une inférence à 100M de tokens alors que le modèle LTM-2-mini en aurait besoin que d'une.

Pour l'instant, il faut prendre cette avancée avec des pincettes car leur modèle est beaucoup plus petit que LlaMa 3.1 405B.
Le seul benchmark utilisé est celui de "Needle in a haystack" qui consiste à retrouver une phrase dans un très long texte mais rien sur la capacité de raisonnement ou les connaissances générales.

Bref, à part les 100M tokens, on a pas plus d'info sur le modèle LTM-2-mini