1306 shaares
Un LLM open-source du niveau de Llama 2 qui obtient une vitesse d'inférence (génération de token) 15x supérieure!
Un LLM open-source du niveau de Llama 2 qui obtient une vitesse d'inférence (génération de token) 15x supérieure!