Search: [c-ai] - Aschen | Sharing the webz

Skeleton of Thought: large language models can do parallel decoding

Un article sur une méthode de prompt engineering pour réduire la latence d'un LLM en découpant une tâche en sous tâche puis en générant chaque partie indépendamment avant de merge le tout.

L'article est pleins d'exemples concrets en annexes

c-ai · text-ai · prompt-engineering

November 21, 2023 at 23:26:47 UTC * · permalink

·

https://arxiv.org/pdf/2307.15337.pdf

Tree of Thoughts: Deliberate Problem Solving with Large Language Models

Un article sur la méthode du Tree of Thoughts pour résoudre des problèmes complexes avec un LLM.

Cet article a le mérite d'être compréhensible et de fournir des exemples concrets

c-ai · text-ai · prompt-engineering

November 21, 2023 at 23:21:56 UTC * · permalink

·

https://arxiv.org/pdf/2305.10601.pdf

CoT-Igniting-Agent

Toute une liste d'articles sur le Chain Of Thought

c-ai · text-ai · prompt-engineering

November 21, 2023 at 23:10:08 UTC * · permalink

·

https://github.com/Zoeyyao27/CoT-Igniting-Agent

OpenChat 3.5 basé sur Mistral est comparable à ChatGPT

OpenChat est une version fine tuné de Mistral 7B qui offre des performances comparable à ChatGPT (version de mars).

Il est aussi plus performant que le modèle Grok de X.com qui fait 30 milliards de paramètres contre 7 milliards pour Mistral.

Plus d'info ici https://twitter.com/baptistejamin/status/1726571942319460381

c-ai · text-ai

November 21, 2023 at 09:17:00 UTC * · permalink

·

https://huggingface.co/openchat/openchat_3.5

AI proxy: fostering a more open ecosystem

Une solution pour utiliser d'autres LLMs en conservant les mêmes API/SDK que pour OpenAI.

Mistral et Claude 2 sont disponibles simplement en changeant l'URL de OpenAI par celle du proxy.

Sous le capot ça utilise les Cloudflare Worker pour réduire la latence au maximum.

c-ai · text-ai · proxy

November 20, 2023 at 18:34:20 UTC * · permalink

·

https://www.braintrustdata.com/blog/ai-proxy

Lost in the Middle: How Language Models Use Long Contexts

Un article qui évalue la performance des LLMs en fonction de l'endroit ou sont les informations dans le prompt.

Avec des prompts de plus en plus long, les LLMs ont tendance à "perdre" de l'information car la complexité du mécanisme d'attention est fonction du carré de la taille du prompt.

Les chercheurs ont trouvé que les informations placées au début et à la fin avaient plus de chance d'être retrouvées/utilisées.

C'est ce qui est placé au début du prompt qui a le plus d'importance pour le LLM, puis ce qui est placé à la fin et tout ce qui est au milieu

c-ai · text-ai · prompt-engineering

November 19, 2023 at 23:30:06 UTC * · permalink

·

https://arxiv.org/pdf/2307.03172.pdf

Announcing Microsoft Copilot Studio

Microsoft lance aussi son service de création d'assistant à la "GPT" avec une intégration avec tous les outils Office 365.

c-ai · text-ai · assistant-ai

November 19, 2023 at 22:49:02 UTC * · permalink

·

https://www.microsoft.com/en-us/microsoft-365/blog/2023/11/15/announcing-microsoft-copilot-studio-customize-copilot-for-microsoft-365-and-build-your-own-standalone-copilots/

From canvas to video game with GenAI

Un jeux vidéo est dessiné sur un canvas avec des explications sur le fonctionnement des différents élements dynamique (score, barre de déplacement, etc)

Ensuite un Agent créer le jeux à partir de ça.

Dans le même genre pour des composants web https://twitter.com/jasoncwarner/status/1725291989506367727?s=46

c-ai · code-ai

November 18, 2023 at 08:19:17 UTC * · permalink

·

https://twitter.com/andreasklinger/status/1725213534806794285?s=46

ishan0102/vimGPT: Browse the web with GPT-4V and Vimium

Une expérimentation de manipulation automatique du browser avec GPT-4V en renfort pour la compréhension des interfaces.

c-ai · text-ai · image-ai · navigateur · interface-manipulation

November 17, 2023 at 11:32:04 UTC * · permalink

·

https://github.com/ishan0102/vimGPT

Google is embedding inaudible watermarks right into its AI generated music

Google ajoute un watermark inaudible dans les fichiers audio générés par son modèle Lyria.

c-ai · audio-ai

November 16, 2023 at 14:56:26 UTC * · permalink

·

https://www.theverge.com/2023/11/16/23963607/google-deepmind-synthid-audio-watermarks

Lindy.ai — Meet Your AI Employee

Un autre bot Agent LLM qui lui propose de réaliser des tâches comme le support.

c-ai · assistant-ai · text-ai

November 15, 2023 at 00:21:08 UTC * · permalink

·

https://www.lindy.ai/

Dust - Amplify your team's potential with customizable and secure AI assistants

Un bot Agent LLM qui centralise le savoir de l'entreprise

c-ai · text-ai · assistant-ai

November 15, 2023 at 00:14:44 UTC * · permalink

·

https://dust.tt/

Did OpenAI End Software With One Release?

OpenAI était surtout un fournisseur d'infrastructure LLM mais avec leurs dernières annonces ils se positionnent également en fournisseurs d'applications.

Il faut faire attention avec OpenAI, le vendor-lock est très important sur la plateforme.

Aussi puisqu'ils sont dans les apps, se sont de potentiels compétiteurs donc il faut réfléchir à deux fois avant de soumettre des Assistants.

c-ai · openai

November 15, 2023 at 00:13:46 UTC * · permalink

·

https://nicoconut.substack.com/p/openai-ended-software-with-one-release?r=jh7eq

Retool State of AI Report 2023

Très intéressant!

En vrac:

10% des développeurs n'utilisent plus du tout Stackoverflow
66% des entreprises ont un usecase GenAI déployé
89% des employés utilisent la GenAI au boulot (15% secrètement)
Copilot est l'outil GenAI le plus populaire après ChatGPT

c-ai · survey

November 14, 2023 at 10:15:25 UTC * · permalink

·

https://retool.com/reports/state-of-ai-2023

Filtrable HNSW - Qdrant

Une explication détaillée de l'algorithme HNSW pour la recherche vectorielle.

J'ai beaucoup l'analogie utilisée par Qdrant avec un voyage.

Quand vous voyagez d'un petit village à un autre:

bus pour Lyon
train pour Paris
avion pour Berlin
train Hambourg
bus pour Lüneburg

Chaque étape utilise un moyen de transport ayant moins de hub et capable de faire de plus grandes distances

L'algorithme HNSW fonctionne selon ce principe, le plan vectoriel est découpé en couches. Plus on est dans une couche haute, moins il y a de vecteurs et plus les vecteurs sont éloignés les uns des autres.

Au fur et à mesure de la recherche, on va de plus en plus bas dans les couches jusqu'à arriver à la dernière et on peut donc récupérer tous les vecteurs les plus proches en un minimum d'opérations.

c-ai · text-ai · embeddings

November 11, 2023 at 18:44:46 UTC * · permalink

·

https://qdrant.tech/articles/filtrable-hnsw/