LTM-2-mini - 100M Token Context Windows - Aschen

1391 shaares

Filters

Links per page

20 50 100

LTM-2-mini - 100M Token Context Windows

Un modèle supportant une fenêtre de contexte de 100M de tokens.

L'avancée c'est surtout une réduction drastique de la mémoire nécessaire, LlaMa 3.1 405B aurait besoin de 638 H100 pour une inférence à 100M de tokens alors que le modèle LTM-2-mini en aurait besoin que d'une.

Pour l'instant, il faut prendre cette avancée avec des pincettes car leur modèle est beaucoup plus petit que LlaMa 3.1 405B.
Le seul benchmark utilisé est celui de "Needle in a haystack" qui consiste à retrouver une phrase dans un très long texte mais rien sur la capacité de raisonnement ou les connaissances générales.

Bref, à part les 100M tokens, on a pas plus d'info sur le modèle LTM-2-mini

c-ai · text-ai · model-ai

September 12, 2024 at 07:18:04 UTC * · permalink

https://magic.dev/blog/100m-token-context-windows

Filters

Links per page

20 50 100