Scalable MatMul-free Language Modeling

1391 shaares

Filters

Links per page

20 50 100

Scalable MatMul-free Language Modeling

Un papier scientifique qui explique une méthode pour faire tourner un LLM sans la multiplication des matrices.

En gros ça signifie qu'on aurait pas besoin de l'acceleration GPU pour faire tourner des LLMs mais qu'on pourrait faire ça sur des CPU standard que tout le monde a déjà.

c-ai · text-ai

June 26, 2024 at 18:36:21 UTC * · permalink

https://arxiv.org/abs/2406.02528

Filters

Links per page

20 50 100