mistral.rs: Blazingly fast LLM inference.

Delete Set public Set private

1381 shaares

Filters

Links per page

20 50 100

mistral.rs: Blazingly fast LLM inference.

Un moteur d'inférence LLM qui fonctionne avec CPU et GPU.

C'est utilisable depuis du code python mais aussi en API HTTP.

Ça supporte la plupart des modèles Open Source:

Mistral 7B et 8x7B
LlaMa 2 et 3
Phi 2 et 3

Pour de la production je conseille d'utiliser le moteur d'inférence de Hugging Face car c'est scalable et surtout maintenu mais c'est une alternative plus portable à garder sous le coude.

c-ai · text-ai · inference

April 27, 2024 at 09:01:00 UTC * · permalink

https://github.com/EricLBuehler/mistral.rs

Filters

Links per page

20 50 100