Weekly - Week 44 (30 octobre 2023) - Aschen

Delete Set public Set private

Weekly Shaarli

Previous week

All links of one week in a single page.

Next week

Week 44 (30 octobre 2023)

What Happened To Google Search?

Une vidéo très intéressante sur le déclin de l'hégémonie de Google.

Cela s'explique notamment par une part de plus en plus importante des recherches Instagram / TikTok qui proposent des résultats plus interactifs (images, vidéos)

Aussi le SEO à une grosse part de responsabilité dans la merdification des résultats avec des articles de plus en plus vides écrits par des IA dans le seul but de placer des mots-clés.

Finalement, on note la montée en puissance de Reddit pour du contenu certifié "User generated" et des réponses de qualité

c-societe search-engine google

Introducing PlayHT 2.0 Turbo ⚡️ - The Fastest Generative AI Text-to-Speech API

Une API de Text-to-Speech avec une latence très basse (300ms).

Ça veut dire que l'on peut envoyer du texte en streaming et recevoir de l'audio en streaming en pluguant GPT4 directement sur Turbo par exemple.

C'est la porte ouvertes aux conversations quasi temps réel (reste encore le Speech-to-Text et surtout l'envoi du prompt à GPT4 qu'il ne sera pas possible de streamer par contre)

c-ai audio-ai

GitHub - kyegomez/tree-of-thoughts: Plug in and Play Implementation of Tree of Thoughts: Deliberate Problem Solving with Large Language Models that Elevates Model Reasoning by atleast 70%

Des exemples de prompt pour faire du Tree of Thought

c-ai text-ai prompt-engineering

GitHub - danswer-ai/danswer: Ask Questions in natural language and get Answers backed by private sources. Connects to tools like Slack, GitHub, Confluence, etc.

Un framework RAG qui est déjà connecté à pleins d'outils et les synchronise dans des bases de données vectorielles.

c-ai retrieval-augmented-generation text-ai

Pourquoi et comment améliorer le LCP (chargement) de vos pages ?

Une série d'articles pour améliorer la vitesse de chargement des pages web.

c-programmation frontend performance javascript

Generative AI exists because of the transformer

Excellent article qui expliquer le fonctionnement des LLMs

c-ai text-ai vulgarisation

Large Language Models Understand and Can Be Enhanced by Emotional Stimuli

Une étude qui démontre des amélioration des performances des LLMs lorsque l'on inclut un enjeu émotionnel dans les questions.

Par exemple: "Rédige un compte rendu sur la RGPD, c'est très important pour ma carrière"

La fin de la phrase va améliorer la qualité de la réponse fournie par le LLM.

c-ai prompt-engineering text-ai

Clean API with Next.js Middleware Pipes

Une technique pour wrapper les handler API dégueulasses forcés par l'utilisation de Express en quelque chose d'un peu plus moderne.

Next.js encore sur Express en 2023 :(

c-programmation framework backend typescript

Vector indexes for Embedding

Une explication de fonctionnement des opérations sur les vecteurs (embedding LLM)

distance euclidienne
produit intérieur négatif
similarité cosinus

C'est avec des indexes Postgres dans cet exemple. L'index HNSW est celui recommandé https://supabase.com/docs/guides/ai/vector-indexes/hnsw-indexes

c-ai embeddings text-ai

GitHub - bmaltais/kohya_ss

Tout ce qu'il faut pour entraîner un LoRA depuis un set d'images.

Un LoRA est un sous modèle d'image qui permet de créer des images dans le même genre que ses images d'entraînement.

c-ai image-ai stable-diffusion

Intent to Ship: HTTPS Upgrades

Google Chrome essaye automatiquement toutes les requêtes en HTTPS et si jamais ça échoue alors il fallback sur HTTP.

Plus d'info https://github.com/dadrian/https-upgrade/blob/main/explainer.md

c-securite ssl navigateur

GitHub Next | Copilot Voice

Ça devait arriver, une version de Copilot qu'on pilote à la voix.

c-ai code-ai voice-ai

authelia/authelia: The Single Sign-On Multi-Factor portal for web apps

Une solution d'authentification Open Source pour applications web.

Authelia se positionne devant les applications en tant que reverse proxy pour ajouter une couche d'authentification.

c-outils authentication open-source single-sign-on

LLM Papers | Olivier Cavadenti

Un fil d'actualité sur les derniers papiers à propos des LLM

c-ai text-ai

Bun hype. How we learned nothing from Yarn

Un article critique sur Bun.

Pas mal de bashing un peu gratuit et de demi vérité:

performances: tout ce qui est lancé en local avec Bun est instant vs plusieurs secondes avec une stack Typescript standard
pas de version manager: Bun vient d'être release et il y a litéralement 3 versions donc pas vraiment besoin, be patient ^^
moins de backward compat que Node: en même temps on attends pas la même chose de Bun, et au moins les features sortent :)

Bref en tout cas je ne pense pas que Bun puisse un jour remplacer Node côté serveur car il y fallut plusieurs années pour que l'industrie fasse confiance à Node et que Node se montre suffisamment mature.

Par contre en local il n'y a rien à dire, bosser dans l'écosystème actuel c'est juste HORRIBLE entre les bundler, les builders, les compilers et les fichiers de config de la mort j'étais à la limite de craquer et heureusement Bun vient régler tout ça.

En plus bonus: c'est instantané de lancer un script ou de run +100 tests unitaires

c-programmation nodejs bun backend

GitHub Next | TestPilot

Un Agent LLM fait par Github qui génère les test unitaires de votre code

c-ai code-ai assistant-ai

How to choose your vector database in 2023?

Un article qui compare différentes bases de données vectorielles pour stocker les embeddings des LLMs et faire de la recherche sémantique.

A noter que si vous avez déjà Postgres ou Elasticsearch, les deux proposent un mode vectoriel.

Les bases de données dédiées aux vecteurs comme Qdrant ou Pinecone ne sont vraiment intéressantes que pour des gros volumes (> 100 000 vecteurs)

c-ai embeddings retrieval-augmented-generation database

Plus de 100 grands films à partager avec vos ados

Pleins de bon films ici :D

c-autres cinema

Meta reveals their serverless platform processing trillions of function calls a day

Retour d'expérience sur ce qui doit être le plus gros cluster Serverless du monde, celui de Meta (plus de 1 millions de d'exécutions/seconde en pic).

Ils ont développé une solution custom (XFaaS) et ils partagent les retours sur une utilisation massive du serverless.

La deuxième partie de l'article parle de la place de XFaaS dans l'architecture de Meta

c-architecture serverless cluster