Daily - September 12, 2024 - Aschen

Delete Set public Set private

Daily Shaarli

Previous day

All links of one day in a single page.

Next day

September 12, 2024

LTM-2-mini - 100M Token Context Windows

Un modèle supportant une fenêtre de contexte de 100M de tokens.

L'avancée c'est surtout une réduction drastique de la mémoire nécessaire, LlaMa 3.1 405B aurait besoin de 638 H100 pour une inférence à 100M de tokens alors que le modèle LTM-2-mini en aurait besoin que d'une.

Pour l'instant, il faut prendre cette avancée avec des pincettes car leur modèle est beaucoup plus petit que LlaMa 3.1 405B.
Le seul benchmark utilisé est celui de "Needle in a haystack" qui consiste à retrouver une phrase dans un très long texte mais rien sur la capacité de raisonnement ou les connaissances générales.

Bref, à part les 100M tokens, on a pas plus d'info sur le modèle LTM-2-mini

c-ai text-ai model-ai