Aschen | Sharing the webz

Vaibhavs10/insanely-fast-whisper

Le nouveau modèle Text-to-Speech de OpenAI, Whisper Large v3, est capable de transcrire 2.5h d'audio en moins de 2 minutes

c-ai · audio-ai

November 22, 2023 at 20:12:10 UTC * · permalink

·

https://github.com/Vaibhavs10/insanely-fast-whisper

Find-my-way fast Tree-based HTTP router

Un routeur HTTP basé sur un arbre et non des regex.

Les regex pour router des requêtes HTTP c'est vraiment bof, lent et très dur à maintenir. Ça reste cependant le choix par défaut pour des "framework" populaires comme Next.js.

c-programmation · performance · http

November 22, 2023 at 14:52:07 UTC * · permalink

·

https://www.npmjs.com/package/find-my-way

Du nouveau dans Workers AI : bonjour Mistral 7B

Mistral 7B est disponible dans les workers de Cloudflare.

C'est une bonne nouvelle car ces worker sont distribués géographiquement et donc on peut espérer une latence d'inférence optimale n'importe ou dans le monde.

c-ai · text-ai · serverless

November 22, 2023 at 14:41:30 UTC * · permalink

·

https://blog.cloudflare.com/fr-fr/workers-ai-update-hello-mistral-7b-fr-fr/

GitHub - WerWolv/ImHex: 🔍 A Hex Editor for Reverse Engineers, Programmers and people who value their retinas when working at 3 AM.

Un visualiseur et éditeur de fichier binaires

c-outils · reverse-engineering

November 22, 2023 at 11:46:58 UTC * · permalink

·

https://github.com/WerWolv/ImHex

RLHF: Reinforcement Learning from Human Feedback

Un article qui parle de l'entrainement des LLMs.

Les LLMs sont d'abord entrainé un contenu de "basse qualité" équivalent à ~15 millions de livre.

Ensuite ils sont fine tuné une première fois avec des prompts/réponses de qualité, par exemple pour le dialogue.

La dernière étape est le RLHF, avec des réponses notés par des utilisateurs afin d'améliorer la dernière couche du modèle.

c-ai · text-ai · llm-training

November 22, 2023 at 08:10:13 UTC * · permalink

·

https://huyenchip.com/2023/05/02/rlhf.html

Half-Life gets a big update for its 25th anniversary - The Verge

Valve sort une nouvelle version de Half-Life pour le 25e anniversaire :-)

Des nouvelles maps multi-joueurs et une mini campagne.

Tout est bon pour éviter HL3 ;p

c-autres · jeu-video

November 22, 2023 at 07:38:35 UTC * · permalink

·

https://www.theverge.com/2023/11/17/23965754/half-life-25th-anniversary-update

Android in the Wild: A Large-Scale Dataset for Android Device Control

Whoa dans cet article les chercheurs ont réussi à manipuler l'interface d'Android avec un LLM.

C'est dans l'émulateur mais c'est quand même impressionnant, ils sont capable de faire des tâches assez complexes comme vider l'historique de navigation de Chrome ou faire des recherches Google

c-ai · text-ai · android · interface-manipulation

November 21, 2023 at 23:43:06 UTC * · permalink

·

https://arxiv.org/pdf/2307.10088.pdf

An open platform for training, serving, and evaluating large language model for tool learning.

Un modèle entrainé depuis LlaMa 2 qui est spécialisé dans l'utilisation d'outils, notamment d'API tierces.

C'est une alternative Open Source à OpenAI et ses assistants

c-ai · text-ai · assistant-ai

November 21, 2023 at 23:39:52 UTC * · permalink

·

https://github.com/OpenBMB/ToolBench

Verify-and-Edit: A Knowledge-Enhanced Chain-of-Thought Framework

Un article sur une méthode permettant d'améliorer la qualité des réponses dans un RAG.

Ils proposent notamment une méthode de prompting pour savoir quand il n'y a pas suffisament d'informations pour répondre:

Determine if there is Observation that SUPPORTS
or REFUTES a Claim, or if there is NOT ENOUGH
INFO.

Claim: The Gadsden flag was named by Christo-
pher Gadsden.

A: First, The Gadsden flag is named after politician
Christopher Gadsden. Second, there is no informa-
tion on who named the Gadsden flag. The answer
is NOT ENOUGH INFO.

c-ai · text-ai · prompt-engineering

November 21, 2023 at 23:36:49 UTC * · permalink

·

https://aclanthology.org/2023.acl-long.320.pdf

Recursion of Thought: A Divide-and-Conquer Approach to Multi-Context Reasoning with Language Models

Dans cet article, les auteurs proposent une autre manière de découper une tâche en sous tâche en permettant au LLM de "créer" une sous tâche en écrivant un token spécial.

La sous tâche est ensuite executé par un LLM "enfant" puis le résultat est ré-incorporé dans la tâche principale.

L'article contient de nombreux exemples.

c-ai · text-ai · prompt-engineering

November 21, 2023 at 23:32:10 UTC * · permalink

·

https://aclanthology.org/2023.findings-acl.40.pdf

Skeleton of Thought: large language models can do parallel decoding

Un article sur une méthode de prompt engineering pour réduire la latence d'un LLM en découpant une tâche en sous tâche puis en générant chaque partie indépendamment avant de merge le tout.

L'article est pleins d'exemples concrets en annexes

c-ai · text-ai · prompt-engineering

November 21, 2023 at 23:26:47 UTC * · permalink

·

https://arxiv.org/pdf/2307.15337.pdf

Tree of Thoughts: Deliberate Problem Solving with Large Language Models

Un article sur la méthode du Tree of Thoughts pour résoudre des problèmes complexes avec un LLM.

Cet article a le mérite d'être compréhensible et de fournir des exemples concrets

c-ai · text-ai · prompt-engineering

November 21, 2023 at 23:21:56 UTC * · permalink

·

https://arxiv.org/pdf/2305.10601.pdf

CoT-Igniting-Agent

Toute une liste d'articles sur le Chain Of Thought

c-ai · text-ai · prompt-engineering

November 21, 2023 at 23:10:08 UTC * · permalink

·

https://github.com/Zoeyyao27/CoT-Igniting-Agent

programming war crimes 4 video

Qu'est-ce qu'on rigole 😁

c-troll · video

November 21, 2023 at 18:32:47 UTC * · permalink

·

https://www.youtube.com/watch?v=Q1sroG_iGnc&feature=youtu.be

OpenChat 3.5 basé sur Mistral est comparable à ChatGPT

OpenChat est une version fine tuné de Mistral 7B qui offre des performances comparable à ChatGPT (version de mars).

Il est aussi plus performant que le modèle Grok de X.com qui fait 30 milliards de paramètres contre 7 milliards pour Mistral.

Plus d'info ici https://twitter.com/baptistejamin/status/1726571942319460381

c-ai · text-ai

November 21, 2023 at 09:17:00 UTC * · permalink

·

https://huggingface.co/openchat/openchat_3.5

AI proxy: fostering a more open ecosystem

Une solution pour utiliser d'autres LLMs en conservant les mêmes API/SDK que pour OpenAI.

Mistral et Claude 2 sont disponibles simplement en changeant l'URL de OpenAI par celle du proxy.

Sous le capot ça utilise les Cloudflare Worker pour réduire la latence au maximum.

c-ai · text-ai · proxy

November 20, 2023 at 18:34:20 UTC * · permalink

·

https://www.braintrustdata.com/blog/ai-proxy

SST, Build modern full-stack serverless applications on AWS with Next.js and others

Une lib AWS qui wrap toute la complexité pour déployer une application fullstack sur AWS.

Ça permet d'utiliser les services AWS comme EC2, S3, RDS (Postgres), de l'authentification et pleins d'autre chose simplement en instanciant des classes dans du code.

c-devops · serverless · cloud · backend · frontend

November 20, 2023 at 11:04:24 UTC * · permalink

·

https://sst.dev/

FerretDB, MongoDB alternative built with Postgres

Une base de données orientée Document comme Mongo DB mais construite avec Postgres.

c-devops · database · nosql

November 20, 2023 at 10:28:49 UTC * · permalink

·

https://www.ferretdb.com/

Lost in the Middle: How Language Models Use Long Contexts

Un article qui évalue la performance des LLMs en fonction de l'endroit ou sont les informations dans le prompt.

Avec des prompts de plus en plus long, les LLMs ont tendance à "perdre" de l'information car la complexité du mécanisme d'attention est fonction du carré de la taille du prompt.

Les chercheurs ont trouvé que les informations placées au début et à la fin avaient plus de chance d'être retrouvées/utilisées.

C'est ce qui est placé au début du prompt qui a le plus d'importance pour le LLM, puis ce qui est placé à la fin et tout ce qui est au milieu

c-ai · text-ai · prompt-engineering

November 19, 2023 at 23:30:06 UTC * · permalink

·

https://arxiv.org/pdf/2307.03172.pdf