Weekly - Week 50 (December 11, 2023) - Aschen

Delete Set public Set private

Weekly Shaarli

Previous week

All links of one week in a single page.

Next week

Week 50 (December 11, 2023)

OpenBao le fork d'HashiCorp Vault

Après Terraform, c'est au tour de Vault, le produit de gestion de secrets de Hashicorps, d'être fork par la communauté.

Le fork est sous la responsabilité de la Linux Foundation et à l'appui financier d'IBM.

C'est une grosse claque pour Hashicorp qui doit peut-être commencer à amèrement regretter son virage closed sources.

c-outils open-source

Phi-2: The surprising power of small language models

Phi-2 est un modèle de seulement 2.7 milliards de paramètre à destination des terminaux mobile.

Malgré sa petite taille, il affiche des performances similaires à Llama 70 ou Mistral 7B.

Il est même plus performant que Gemini Nano 2 alors qu'il est plus petit que celui-ci (3.2B vs 2.7B)

EDIT: plutôt décevant finalement

c-ai text-ai nano-ai

La plateforme | Mistral AI | Open source models

Mistral propose maintenant ses propres API d'inférence pour leurs modèles.

Outre les modèles de génération de texte, ils proposent aussi un modèle d'embeddings en 1024 dimensions qui offre des performances similaires à ada-2 de OpenAI sur le benchmark MTEB (56.32 vs 55.26 pour Mistral en retrieval)

Au niveau du prix, c'est la même chose que OpenAI, c-a-d 0.1$ pour 1 million de tokens.

c-ai text-ai embeddings open-source

PopUpOFF - Popup and overlay blocker

Un bloqueur de popup, cookies et autres éléments qui pourrissent l'expérience web.

Un régale.

c-autres publicite

Sous le capot des bases de données vectorielles

Un article très détaillé sur le fonctionnement des bases de données vectorielles.

Encore une fois, ces "bases de données" servent surtout à faire de la recherche sémantique qui peut être considéré comme un fonctionnalité plutôt qu'un produit à part entière.

Postgres et Elasticsearch proposent de la recherche vectoriel en plus de toutes les autres fonctionnalités d'une application tout en offrant des performances similaires.

c-ai embeddings

MemoryCache is an experimental developer project to turn a local desktop environment into an on-device AI agent.

Un projet soutenu par Firefox qui sauvegarde les sites que vous visitez puis les utilise dans un RAG local construit avec PrivateGPT.

Cela permet de chercher dans les sites qu'on a pu visiter plutôt que tout internet.

c-ai retrieval-augmented-generation navigateur

Home | Tabby Copilot

Une version Open Source de Github Copilot.

C'est du self-hosted avec les modèles suivants:

TabbyML/StarCoder-7B
TabbyML/CodeLlama-13B
TabbyML/DeepseekCoder-6.7B

c-ai code-ai open-source

Mixtral of experts | Mistral AI | Open source models

Le nouveau modèle de Mistral a été release, c'est un modèle de type "Mixture of Experts" qui contient en réalité 8 modèles spécialisés dans des tâches en particulier.

Ils annoncent des performances meilleures que Llama 70B sur la plupart des benchmark tout en ayant une inférence 6x plus rapide!

Plus d'info sur Mixture of Experts

c-ai text-ai open-source

LLMCompiler: An LLM Compiler for Parallel Function Calling

LLMCompiler est une alternative à la méthode ReAct pour la planification et l'exécution de tâches.

2 composants:

LLM Planer: découpe les tâches dans un Directed Acyclic Graph (DAG) pour une exécution en parallèle et un respect des dépendances
Executor: un Agent qui exécute les différentes tâches avec les outils à sa disposition

Le LLM Planer est capable de recréer le DAG avec le résultat de chaque tâche pour une planification dynamique (e.g. embranchement if/else)

Concrètement ils ont mesuré des améliorations dans le processus de raisonnement sur certains benchmark comme HotspotQA mais c'est surtout la latence qui est réduite grâce à la parallélisation des tâches

c-ai assistant-ai text-ai

OutfitAnyone - a Hugging Face Space by HumanAIGC

A peine quelques semaines après la sortie du modèle AnimateAnyone, les équipes de Alibaba proposent une cabine d'essayage virtuelle.

Une véritable révolution pour le e-commerce !

c-ai image-ai

GPT4 vs Mistral for code generation

Les résultats de Mistral en one-shot code generation sont meilleurs que ceux de GPT4.

J'ai testé moi même sur ses exemples et j'obtiens plus ou moins les mêmes résultats.

Après les capacités d'un LLM ne sont pas évaluable uniquement avec des demandes en one-shot et d'ailleurs GPT4 se démarque par ses capacités de "raisonnement" qui s'exprime plutôt avec des Chain of Thoughts et autres méthodes multi-shot.

c-ai code-ai

Why Meta is fighting for Open Source LLMs while Microsoft wants to regulate them.

Une excellente analyse de la situation actuelle ou Google et Microsoft se battent d'un côté contre l'Open Source avec principalement Meta de l'autre côté du ring.

Google est enfaite en position d'avance technologique en GenAI depuis des années, c'est à eux qu'on doit l'architecture Transformers à la base de toute la GenAI mais aussi le premier LLM: BERT.

Ils sont juste assez mauvais en terme de communication et leurs succès ne sont pas reconnus du grand publique.

De leur côté, Amazon et Apple sont assez tranquille pour expérimenter petit à petit sans que cela fasse de vagues, notamment sur la cotation boursière.

c-ai open-source gafam

Google Monorepo

Google a un monorepo depuis 16 ans avec tous le code source des projets.

1 milliard de fichiers et 35 millions de commit. C'est juste incroyable.

c-programmation git