Daily Shaarli

All links of one day in a single page.

December 12, 2023

Phi-2: The surprising power of small language models

Phi-2 est un modèle de seulement 2.7 milliards de paramètre à destination des terminaux mobile.

Malgré sa petite taille, il affiche des performances similaires à Llama 70 ou Mistral 7B.

Il est même plus performant que Gemini Nano 2 alors qu'il est plus petit que celui-ci (3.2B vs 2.7B)

EDIT: plutôt décevant finalement

Why Meta is fighting for Open Source LLMs while Microsoft wants to regulate them.

Une excellente analyse de la situation actuelle ou Google et Microsoft se battent d'un côté contre l'Open Source avec principalement Meta de l'autre côté du ring.

Google est enfaite en position d'avance technologique en GenAI depuis des années, c'est à eux qu'on doit l'architecture Transformers à la base de toute la GenAI mais aussi le premier LLM: BERT.

Ils sont juste assez mauvais en terme de communication et leurs succès ne sont pas reconnus du grand publique.

De leur côté, Amazon et Apple sont assez tranquille pour expérimenter petit à petit sans que cela fasse de vagues, notamment sur la cotation boursière.

Home | Tabby Copilot
thumbnail

Une version Open Source de Github Copilot.

C'est du self-hosted avec les modèles suivants:

  • TabbyML/StarCoder-7B
  • TabbyML/CodeLlama-13B
  • TabbyML/DeepseekCoder-6.7B