Monthly Shaarli
September, 2023
Un jeu pour comprendre la notion de confiance dans un environnement sociale.
Ils utilisent un algorithme génétique à l'étape 2 pour se faire "reproduire" les personnages.
Quelques take away:
- être toujours gentil n'est pas une bonne idée
- adapter son comportement à son interlocuteur
- chercher le gagnant-gagnant
- les erreurs de communications sont fatales
Un papier scientifique qui résume les différentes méthodes de raisonnement avec les LLM.
Un test de Visual Question Answering (VQA) avec GPT-4 et le modèle est très bon!
Une marketplace ou l'on peut trouver des Agents disponibles pour toute sortes de tâches: SEO, chatbot, revenue manager, adword, etc
Un stablecoin assez évolué qui maintient la parité avec l'euro.
Ils ont un système assez complexe pour ça, basé sur des fonds variables dans une multitude de crypto assets https://docs.angle.money/transmuter/transmuter
Ça donne envie d'y croire ou au moins de garder un œil la dessus.
Ils ont levé 5 millions dans un round lead par Andressen Horowitz donc c'est quand même un gage de non-bullshit.
Une IA générative qui génère du son depuis un prompt.
ça rend super bien, ils sont capable de générer des musiques entières avec des paroles et un genre précis genre "Upbeat EDM"
Une alternative open source à Datadog et NewRelic pour l'observabilité et l'agrégation des logs.
Retour d'expérience sur le développement de Github Copilot et donc d'une véritable application LLM en prod depuis plusieurs années et avec un trafic conséquent
Le piratage reste un des meilleur moyen d'assurer la pérennité des œuvres dans le temps.
Un autre article qui résume bien les possibilités de Supabase.
Aussi, des retours de Ali de Tech.rocks:
So far les craintes soulevées :
Le système d’Auth semble extensible mais par exemple ne semble pas gérer de token CSRF out of the box (lorsque le client et le server sont sur le même host, les cookies transmettent le jwt à la place d’un authentification bearer). On est en train d’explorer le flux sur un host différent.
Le back-end est composé grosso-modo d’une base postgres dont les tables sont exposées via une API REST ou GraphQL et d’edge functions
-> cela nous pose la question de comment mettre en place une couche de service métier exposée via API correctement testée
-> pas encore 100% convaincu par rapport à une stack classique Serverless ou Nest
-> on va expérimenter les edge functions mais à trouver/confirmer encore la bonne architecture pour créer notre couche métier (si vous avez des pointeurs)
je suis comme toi, je ne souhaite pas mettre trop de logique métier dans le SQL car beaucoup plus difficilement testable automatiquement et unitairement ? d’autant plus quand l’équipe grandit ? (si vous avez des pistes également nous sommes preneur)
le côté admin wysiwyg est séduisant mais rarement utilisé dans un vrai env de dev. On est en train d’évaluer la développeur expérience avec un env de dev local tout ce qui est database migrations, type generation, testing pour avoir un workflow dev/preprod/prod correct.
Les choix architecturaux de back-end sur lesquels on hésite sont : soit backend-as-a-service comme supabase, construire l’ensemble du back 100% en serverless derrière une API gateway, utiliser une architecture plus classique comme Nest.js
Une question en suspens, est quelle serait la meilleure architecture de départ pour implémenter du realtime (basé sur des sockets) pour avoir du push vers le client lors de mise à jour dans la base ?Un service de review de PR avec un LLM.
ça fait un résumé des changements de chaque fichier de la PR mais aussi des conseils sur le code modifié
Testé sur 2 PR
L'organisme (NVD) qui gère les CVE (publication de faille de sécurité) n'est pas forcément très regardant sur les rapports qui lui sont publiés.
Ils ont accepté une CVE sur CURL avec une date dans le passé (2020) à propos d'un simple bug et non d'une faille de sécurité. Et il l'ont classé avec une sévérité de 9.8/10
Une liste de conseils pour CTO
Pleins de projets autour de l'écosystème de LangChain.
Une véritable mine d'or
Un site qui recense toutes les fuites ou utilisation illicite des données stockées dans des cloud
Un outil pour faire des vidéos au rendu impeccable de votre code.
Effet zoom-in, zoom-out, inclusion de votre webcam, etc
Un site qui permet de connaitre le temps approximatif pour finir un jeu.
Un outil open source avec tout ce qu'il faut pour analyse l'utilisation de son produit, l'améliorer et le déployer:
- analytics
- session replay
- feature flags
- A/B testing
Une technologie qui permettrait d'accèlérer l'entrainement des modèles d'IA et aussi d'en réduire les coûts.
Incroyable les amélioration apportées à DALL-E 3 autant au niveau de la qualité qu'au niveau du prompt engineering!
Clairement ils ont rattrapé le retard sur leurs concurrents (StableDiffusion et Midjourney) mais surtout ils ont maintenant une longueur d'avance sur ce qui fonctionnait le moins bien: le prompt engineering
Un article qui parle du chemin de carrière technique (vs le chemin managérial de l'engineering manager par exemple)
Les rôles de staff engineer sont des rôles de spécialistes technique avec une forte composante de leadership et de mentoring.
Ils doivent se concentrer sur les résultats des projets qu'ils prennent en main et sont plus pro-actifs que les développeurs senior.
L'utilisation de Protobuf se démocratise de plus en plus pour remplacer le JSON en tant que format d'échange de données.
Cela devrait être le choix par défaut pour toute communication inter-serveur.
Attention néanmoins dans les environnements JS la différence de performances n'est pas assurée donc pensez à benchmarker ;-)
Un LLM open-source du niveau de Llama 2 qui obtient une vitesse d'inférence (génération de token) 15x supérieure!
Retour d'expérience sur Supabase et quelques une de ses limitations
- pas de raw sql query "out of the box"
- définition de la DB en SQL vs avec un schéma à la Prisma
- couplage fort DB / frontend
- Système de droits ABAC (attributs based)
Une solution pour utiliser Nest.js devant Supabase tout en conservant le système d'authentification de Supabase.
Supabase propose de faire des Edge Function pour la logique métier spécifique en Dart.
C'est cool car ça contribue à populariser l'utilisation de Dart pour le backend.
Un schéma builder pour GraphQL
Un plugin vscode qui assiste dans la création de tests avec de L'IA générative.
Un site qui permet de comprendre l'étendue des connaissances qu'ont sur nous les GAFAM.
Il faut faire une demande d'accès RGPD à ses données et les uploader ici (sic)
Facebook, Google et Twitter sont concernés
Un service pour récupérer un flux RSS depuis les sites qui n'en proposent pas
Mistral annonce son premier modèle en Open Source (Apache 2.0) et ils annoncent des performances supérieures à LlaMa 2 7B!
C'est le premier LLM 100% européen
Un boilerplate pour lancer un produit avec tout ce qu'il faut:
- app front (Tailwind) et back avec Next.js et MongoDB
- Stripe déjà configuré pour le paiement
- Mailgun pour les mail
- NextAuth avec Google login ou magic link
- SEO etc
Un système de désalinisation qui fonctionne à l'énergie solaire et qui est plus efficace que tout ce qui existe actuellement.
Ils parlent de 4-5 litres d'eau par heure pour une machine de la taille d'une valise !
Carrefour pousse pour l'adoption de la GenAI en interne, que ce soit au niveau des équipes avec des milliers de collaborateurs formés à ChatGPT ou sur des projets comme le chatbot Hopla.
Quelques statistiques sur l'utilisation de Copilot:
- 30% des suggestions sont acceptées
- tâches effectuées 50% plus vite
- 46% du code total écrit par Copilot
- 75% des développeurs sont satisfait
- 1500 milliards de plus au PIB global du à la productivité supplémentaire
Connecting Large Language Models with Evolutionary Algorithms Yields Powerful Prompt Optimizers
https://arxiv.org/pdf/2309.08532.pdf
Large Language Models as Optimizers
https://arxiv.org/abs/2309.03409
Improving prompt for document summarization using Chain of Density prompting
https://arxiv.org/pdf/2309.04269.pdf
Vercel a développé un super outil pour comparer les résultats des prompts entre plusieurs LLM!
Ils supportent quasiment tout, des modèles GPT à LlaMa 2 et même Claude 2.
Stablitity AI se lance dans la génération d'audio.
Des musiques mais aussi des sons d'ambiance !
Un service pour créer des clips vidéo facilement.
Ils proposent notamment de traduire dans n'importe quelle langue en gardant la même voix + le mouvement des lèvres
Plusieurs article sur la manière de créer une timeline pour une application à fort trafic en utilisant Redis.
https://redis.io/docs/manual/patterns/twitter-clone/
https://livebook.manning.com/book/redis-in-action/chapter-8/
Bun est sorti en version 1.0 et ça s'annonce très prometteur.
Finit les prises de tête de l'écosystème Node.js, ça règle tous les problèmes de toolchain de run Typescript, de build en tout genre, de test runner, de module mjs/esm, de require vs import, de package manager en fournissant un seul outil qui just works
Même pas besoin de "risquer" une utilisation en prod, juste le fait de l'utiliser comme toolchain backend fait gagner en productivité.
Un agent LLM dans le terminal qui peut contrôler votre ordinateur, executer du code, naviguer sur internet etc.
Un site qui résume les conditions d'utilisation de nombreux sites.
Un modèle de reflexion utilisant des LLM en plusieurs étapes pour arriver à une conclusion.
ça résume également les autres techniques, Chain of Thought, Tree of Thought, etc
Analyse intéressante du scaling des modèles d'IA
Un agent Minecraft utilisant GPT qui est capable d'apprendre de nouvelles compétences en générant et sauvegardant du code utilisé ensuite pour manipuler le jeu.
Les compétences sont sauvegardés dans une base de données vectorielle