Microsoft annonce développer des micro processeurs (Neural Processing Unit, NPU) dédiés aux algorithme des IA génératives, un peu comme les cartes graphiques sont normalement dédiées au calcul sur les images.
Le but est de permettre l'utilisation de ces algorithme directement depuis l'ordinateur personnel des utilisateurs de Windows.
ça rappel les TPU (Tensor Processing Unit) de Google pour les solutions cloud et Tensorflow https://cloud.google.com/tpu
Microsoft peut se permettre de perdre autant d'argent maintenant si c'est pour s'assurer la suprématie dans 5 ans quand le coût des technos aura diminué.
En attendant, aucune startup ne peut les concurrencer, voir aucune autre boite vu le fric qu'à Microsoft.
Facebook se lance dans la course au développement assisté par IA avec un prototype de recherche autour de la correction de bugs!
Un article sur différentes techniques pour réduire les hallucinations des LLMs
Présentation de l'architecture Backend for Frontends telle qu'elle a été conceptualisé au départ chez Souncloud
Un outil de data visualisation qui peut se connecter à la plupart des bases de données afin de créer des dashboards.
C'est un aggrégateur de sources de données pour créer des dashboards assez facilement.
Le but de ce genre d'outil c'est que l'équipe data se charge de la stratégie de collecte mais ensuite chaque équipe est responsable de créer ses propres metriques un utilisant le système de dashboarding.
Aussi le produit est open source donc on peut commencer en SaaS et passer en OS quand ça coûte trop cher et inversement
Un repo Github qui résume les derniers articles à propos des LLM
Une carte en temps réelle des satellites
Un article qui parle des uuidv7 qui comportent une composante temporelle pour être triable par défaut tout étant utilisables dans des systèmes distribués car uniques.
Les performances sont bien supérieures et ça vient du fait qu'ils possèdent une partie aléatoire moins importante (en plus du fait qu'ils soient triable)
Comparaison de la latence entre différents accès: CPU cache, RAM, SSD, Network
Un article très intéressant d'un big tech (Facebook) sur la manière dont ils ont scale leur cache basé sur Memcached à l'échelle de la planète.
Un outil no-code pour construire des applications LLM
Un jeu pour comprendre la notion de confiance dans un environnement sociale.
Ils utilisent un algorithme génétique à l'étape 2 pour se faire "reproduire" les personnages.
Quelques take away:
- être toujours gentil n'est pas une bonne idée
- adapter son comportement à son interlocuteur
- chercher le gagnant-gagnant
- les erreurs de communications sont fatales
Un site qui recense toutes les fuites ou utilisation illicite des données stockées dans des cloud
Mistral annonce son premier modèle en Open Source (Apache 2.0) et ils annoncent des performances supérieures à LlaMa 2 7B!
C'est le premier LLM 100% européen
Un outil pour faire des vidéos au rendu impeccable de votre code.
Effet zoom-in, zoom-out, inclusion de votre webcam, etc
Un boilerplate pour lancer un produit avec tout ce qu'il faut:
- app front (Tailwind) et back avec Next.js et MongoDB
- Stripe déjà configuré pour le paiement
- Mailgun pour les mail
- NextAuth avec Google login ou magic link
- SEO etc
Un site qui permet de connaitre le temps approximatif pour finir un jeu.
Un papier scientifique qui résume les différentes méthodes de raisonnement avec les LLM.
Un système de désalinisation qui fonctionne à l'énergie solaire et qui est plus efficace que tout ce qui existe actuellement.
Ils parlent de 4-5 litres d'eau par heure pour une machine de la taille d'une valise !