Weekly Shaarli

All links of one week in a single page.

Week 46 (13. November 2023)

Lost in the Middle: How Language Models Use Long Contexts

Un article qui évalue la performance des LLMs en fonction de l'endroit ou sont les informations dans le prompt.

Avec des prompts de plus en plus long, les LLMs ont tendance à "perdre" de l'information car la complexité du mécanisme d'attention est fonction du carré de la taille du prompt.

Les chercheurs ont trouvé que les informations placées au début et à la fin avaient plus de chance d'être retrouvées/utilisées.

C'est ce qui est placé au début du prompt qui a le plus d'importance pour le LLM, puis ce qui est placé à la fin et tout ce qui est au milieu

Google is embedding inaudible watermarks right into its AI generated music
thumbnail

Google ajoute un watermark inaudible dans les fichiers audio générés par son modèle Lyria.

Lindy.ai — Meet Your AI Employee
thumbnail

Un autre bot Agent LLM qui lui propose de réaliser des tâches comme le support.

Did OpenAI End Software With One Release?
thumbnail

OpenAI était surtout un fournisseur d'infrastructure LLM mais avec leurs dernières annonces ils se positionnent également en fournisseurs d'applications.

Il faut faire attention avec OpenAI, le vendor-lock est très important sur la plateforme.

Aussi puisqu'ils sont dans les apps, se sont de potentiels compétiteurs donc il faut réfléchir à deux fois avant de soumettre des Assistants.

Reasons to prefer blake3 over sha256

Blake3 est plus sur que SHA256 et sûrement plus sur que Keccak qui a gagné le concours SHA3.

C'est aussi l'algorithme le plus performant dans les benchmarks

Announcing Microsoft Copilot Studio

Microsoft lance aussi son service de création d'assistant à la "GPT" avec une intégration avec tous les outils Office 365.

Stripe Chargeback Protection
thumbnail

Une solution simple pour gérer les dispute sur Stripe et éviter un ban

From canvas to video game with GenAI

Un jeux vidéo est dessiné sur un canvas avec des explications sur le fonctionnement des différents élements dynamique (score, barre de déplacement, etc)

Ensuite un Agent créer le jeux à partir de ça.

Dans le même genre pour des composants web https://twitter.com/jasoncwarner/status/1725291989506367727?s=46

The Linux kernel scheduler has been accidentally hardcoded to a maximum of 8 cores for the past 15 years and nobody noticed – The HFT Guy
thumbnail

Une limitation codé en dur dans le kernel Linux limitait son utilisation du d'une machine à 8 coeurs seulement.

On devrait voir une amélioration des perfs dans la prochaine version.

Découverte de l'Opportunity Solution Tree
thumbnail

Une alternative à l'organisation avec une Todo list

Unlighthouse - Site-wide Google Lighthouse
thumbnail

Un outil open source pour mesurer la performance des applications frontend.

Ça s'intègre même à la CI !

GitHub - ekzhang/bore: 🕳 bore is a simple CLI tool for making tunnels to localhost
thumbnail

Une alternative à Ngrok et en plus ça peut être hébergé sur son propre serveur.

Bore permet de rediriger du traffic depuis internet vers un processus local. Ça permet par exemple de recevoir des webhooks en local

ishan0102/vimGPT: Browse the web with GPT-4V and Vimium
thumbnail

Une expérimentation de manipulation automatique du browser avec GPT-4V en renfort pour la compréhension des interfaces.

Plane deviendra t'il une alternative sérieuse à JIRA ?
thumbnail

Un outil de gestion de projet mais rien à voir avec Jira car c'est moderne, rapide et bien fait

Dust - Amplify your team's potential with customizable and secure AI assistants

Un bot Agent LLM qui centralise le savoir de l'entreprise

Retool State of AI Report 2023
thumbnail

Très intéressant!

En vrac:

  • 10% des développeurs n'utilisent plus du tout Stackoverflow
  • 66% des entreprises ont un usecase GenAI déployé
  • 89% des employés utilisent la GenAI au boulot (15% secrètement)
  • Copilot est l'outil GenAI le plus populaire après ChatGPT
dlt - data load tool
thumbnail

Une lib en Python pour charger des données depuis différentes sources dans des databases.

ça supporte notamment Slack, Notion, Github en source.

Par contre j'ai l'impression que c'est limité à de la synchronisation one shot et pas forcément à une mise à jour des documents retrouvés