Aschen | Sharing the webz

Supabase MCP can leak your entire SQL database

Une attaque de prompt injection par MCP assez sophistiquée.

une application de réponse aux tickets de support à un accès limité au MCP de Supabase,
l'attaquant envoi un message contenant une prompt injection
un développeur lit plus tard dans la table des tickets via son serveur MCP Cursor et exécute l'instruction malicieuse
l'attaquant peut voir les données privées extraites dans sa conversation

Il n'y a pas d'erreur de configuration dans les droits, cependant les LLMs permettent de faire des "sauts" entre les utilisateurs/permissions en laissant des instructions malicieuses au bon endroit.

c-ai · prompt-injection

July 9, 2025 at 15:22:46 UTC * · permalink

·

https://www.generalanalysis.com/blog/supabase-mcp-blog

Mercury: Ultra-Fast Language Models Based on Diffusion

Mercury est un modèle spécialisé dans la génération de code mais qui fonctionne selon le principe de diffusion.

Au lieu de générer un stream de tokens, il fonctionne comme un modèle de génération d'image en générant une réponse contenant une première version des tokens puis en itérant sur tous les tokens de cette réponse.

Une très bonne visualisation de ce principe est disponible sur le site de Google pour Gemini Diffusion

Le modèle Mercury est disponible en deux versions Mini (1000 tok/sec) et Small (700 tok/sec)

Les performances de Small sont comparables aux modèles Gemini 2.5 Flash-Lite (200 tok/sec) ou GPT-4o mini (60 tok/sec).

On peut tester la vitesse directement sur https://chat.inceptionlabs.ai/

Les DiffusionLM ont fait du chemin depuis les premiers papiers sortis en décembre 2024, c'est une architecture qui a beaucoup d'avenir étant donné les performances et la vitesse !

c-ai · text-ai · diffusion-lm

July 7, 2025 at 13:51:14 UTC * · permalink

·

https://arxiv.org/pdf/2506.17298

Introducing pay per crawl: enabling content owners to charge AI crawlers for access

c-ai

July 1, 2025 at 15:56:53 UTC * · permalink

·

https://blog.cloudflare.com/introducing-pay-per-crawl/

Agentic Misalignment

c-ai

June 30, 2025 at 16:44:02 UTC * · permalink

·

https://www.anthropic.com/research/agentic-misalignment

Casser les mots de passe de ses utilisateurs avec le plus gros dictionnaire français du monde | Le blog de Zythom

c-securite

May 12, 2025 at 14:42:33 UTC * · permalink

·

https://zythom.fr/2025/04/casser-les-mots-de-passe-de-ses-utilisateurs-avec-le-plus-gros-dictionnaire-francais-du-monde/

humanlayer/12-factor-agents: What are the principles we can use to build LLM-powered software that is actually good enough to put in the hands of production customers?

Cela résume très bien les bonnes pratiques dans le développement d'agents et de systèmes LLM en général

c-ai

April 18, 2025 at 19:41:13 UTC * · permalink

·

https://github.com/humanlayer/12-factor-agents

Composio - Access 250+ Apps in Just One Line of Code - Composio

Un repository d'outils pour LLM au format MCP.

On y retrouve Gmail, Github, Slack et plus de 200 intégrations.

Ça gère l'authentification si besoin en ouvrant une fenêtre du navigateur pour la demander.

c-ai · assistant-ai · model-context-protocol

March 24, 2025 at 18:36:26 UTC * · permalink

·

https://composio.dev/

Pappers Immobilier : toutes les données immobilières sur une plateforme unique

Un site pour consulter tout un tas d'informations en accès libre.

Par exemple ici ce sont les données du cadastre liées aux ventes de biens immobilliers

c-outils · osint

March 16, 2025 at 09:15:48 UTC * · permalink

·

https://immobilier.pappers.fr/

compar:IA, le comparateur d'IA conversationnelles

Le gouvernement a sorti un comparateur d'IA en mode arène.

Ça permet de comparer les réponses de deux IA à une question pour alimenter un dataset afin de les comparer.

Au passage, ça donne des informations sur les modèles (après avoir voté) et la consommation énergétique.

c-ai · text-ai

February 18, 2025 at 16:53:11 UTC * · permalink

·

https://www.comparia.beta.gouv.fr/

Mirascope/mirascope: LLM abstractions that aren't obstructions

La meilleure lib pour utiliser des LLMs en Python selon moi car ils supportent:

quasiment tous les providers
la génération structurée
les input multi-modaux
du streaming
le retry

Bref, tout ce qu'il faut pour faire sérieusement du LLM Engineering en python.

La documentation est ici

c-ai · text-ai

February 16, 2025 at 19:05:36 UTC * · permalink

·

https://github.com/mirascope/mirascope

LLM Leaderboard - Compare GPT-4o, Llama 3, Mistral, Gemini & other models

Ce site est pas mal lorsqu'il s'agit de comparer les modèles sur leurs différentes caractéristiques:

taille de la fenêtre de contexte
"intelligence"
prix du million de token
vitesse de génération de token

c-ai · text-ai

February 16, 2025 at 08:31:18 UTC * · permalink

·

https://artificialanalysis.ai/leaderboards/models

s1: Simple test-time scaling

Une technique intéressante pour améliorer les capacités des modèles de raisonnement des modèles, même les petits modèles entrainés sur de petits dataset.

Ici le modèle s1 possède seulement 32 milliards de paramètres (32B) mais est capable de dépasser les performances du modèle o1-preview d'OpenAI.

Leur approche se base sur deux techniques;

limiter la "longueur" du raisonnement (les "reasoning tokens") en ajoutant à un moment de l'inférence un token indiquant au modèle qu'il doit fournir sa réponse définitive
forcer le modèle à réfléchir sur la solution qu'il a généré jusqu'à maintenant en insérant "Wait" à la fin de la séquence de raisonnement

Le simple fait d'insérer "Wait', force le modèle à réfléchir sur la solution qu'il a envisagé et leur permet d'atteindre des performances similaires à un énorme modèle comme o1-preview.

C'est assez impressionnant car cela veut dire que de simples techniques de Prompt Engineering peuvent permettre d'atteindre des performances qui rivalisent avec celles des gros modèles.

c-ai · text-ai

February 10, 2025 at 07:54:43 UTC * · permalink

·

https://arxiv.org/pdf/2501.19393

microsoft/SoM: Set-of-Mark Prompting for GPT-4V and LMMs

Set of Mark c'est la technique qui consiste à annoter une image avec des numéro avant de la passer à un LLM vision.

Ça permet au LLM d'identifier précisément les entités et de les citer dans le prompt.

C'est ce qui est utilisé dans beaucoup de systèmes de manipulation d'interface pour que le LLM puisse identifier les différentes parties de l'interface.

c-ai · image-ai

February 9, 2025 at 22:01:03 UTC * · permalink

·

https://github.com/microsoft/SoM

.CursorRules

Un annuaire d'instructions à ajouter dans les règles custom de Cursor (.cursorrules).

Il y a des règles spécialisées pour les langages, frameworks, etc

c-ai · code-ai

February 9, 2025 at 18:03:24 UTC * · permalink

·

https://dotcursorrules.com/

[Enquête] Plus de 1 000 médias en français, générés par IA, polluent le web (et Google)

Le nombre de contenu généré par IA explose.

Certains de ces articles généré par IA et publié souvent sans être vérifiés sont ensuite utilisés comme source sur Wikipedia.

c-ai · text-ai

February 8, 2025 at 16:22:26 UTC * · permalink

·

https://next.ink/153613/enquete-plus-de-1-000-medias-en-francais-generes-par-ia-polluent-le-web-et-google/

PDF extraction with Gemini 2.0 flash

Gemini 2.0 flash obtient les meilleurs résultats sur la reconnaissance et l'extraction de texte depuis un PDF que la plupart des autres solutions du marché.

L'auteur propose aussi d'utiliser le LLM pour découper le texte en chunk de taille convenable conservant la même thématique.

c-ai · text-ai

February 7, 2025 at 17:10:43 UTC * · permalink

·

https://www.sergey.fyi/articles/gemini-flash-2

OpenAI o3-mini is now available in GitHub Copilot Free

OpenAI et Github ont rendu le modèle o3-mini disponible dans l'extension Copilot.

Le modèle est configuré sur le niveau de raisonnement "moyen" ce qui en fait l'un des meilleurs modèles du marché (3e position sur Livebench)

Cependant, Claude 3.5 Sonnet a toujours les meilleurs résultats dans les benchmarks uniquement en code (67 contre 65 pour o3-mini-medium)

c-ai · code-ai

February 7, 2025 at 12:36:53 UTC * · permalink

·

https://github.blog/changelog/2025-02-06-openai-o3-mini-is-now-available-in-github-copilot-free/

Launch YC: Osmosis: Unlocking Real-Time Learning for AI Agents | Y Combinator

c-ai

February 7, 2025 at 11:07:45 UTC * · permalink

·

https://www.ycombinator.com/launches/Mkt-osmosis-unlocking-real-time-learning-for-ai-agents

Jim & Jimmies : comment Partoo transforme sa plateforme SaaS en Multi-agent System ?

c-ai

February 5, 2025 at 15:09:25 UTC * · permalink

·

https://www.followtribes.io/saas-multi-agent-system/

https://omnihuman-lab.github.io/

Bytedance (TikTok) ont sorti un modèle de génération de vidéo spécialisé dans la génération de personnes.

Depuis une image, un enregistrement audio, une vidéo sans audio ou une combinaison des deux, ils peuvent générer des vidéos entières quasiment sans artefacts (hallucinations).

Le modèle est privé pour le moment.

c-ai · video-ai

February 5, 2025 at 10:21:02 UTC * · permalink

·

https://omnihuman-lab.github.io/