Search: [text-ai] - Aschen | Sharing the webz

Android in the Wild: A Large-Scale Dataset for Android Device Control

Whoa dans cet article les chercheurs ont réussi à manipuler l'interface d'Android avec un LLM.

C'est dans l'émulateur mais c'est quand même impressionnant, ils sont capable de faire des tâches assez complexes comme vider l'historique de navigation de Chrome ou faire des recherches Google

c-ai · text-ai · android · interface-manipulation

November 21, 2023 at 23:43:06 UTC * · permalink

·

https://arxiv.org/pdf/2307.10088.pdf

An open platform for training, serving, and evaluating large language model for tool learning.

Un modèle entrainé depuis LlaMa 2 qui est spécialisé dans l'utilisation d'outils, notamment d'API tierces.

C'est une alternative Open Source à OpenAI et ses assistants

c-ai · text-ai · assistant-ai

November 21, 2023 at 23:39:52 UTC * · permalink

·

https://github.com/OpenBMB/ToolBench

Verify-and-Edit: A Knowledge-Enhanced Chain-of-Thought Framework

Un article sur une méthode permettant d'améliorer la qualité des réponses dans un RAG.

Ils proposent notamment une méthode de prompting pour savoir quand il n'y a pas suffisament d'informations pour répondre:

Determine if there is Observation that SUPPORTS
or REFUTES a Claim, or if there is NOT ENOUGH
INFO.

Claim: The Gadsden flag was named by Christo-
pher Gadsden.

A: First, The Gadsden flag is named after politician
Christopher Gadsden. Second, there is no informa-
tion on who named the Gadsden flag. The answer
is NOT ENOUGH INFO.

c-ai · text-ai · prompt-engineering

November 21, 2023 at 23:36:49 UTC * · permalink

·

https://aclanthology.org/2023.acl-long.320.pdf

Recursion of Thought: A Divide-and-Conquer Approach to Multi-Context Reasoning with Language Models

Dans cet article, les auteurs proposent une autre manière de découper une tâche en sous tâche en permettant au LLM de "créer" une sous tâche en écrivant un token spécial.

La sous tâche est ensuite executé par un LLM "enfant" puis le résultat est ré-incorporé dans la tâche principale.

L'article contient de nombreux exemples.

c-ai · text-ai · prompt-engineering

November 21, 2023 at 23:32:10 UTC * · permalink

·

https://aclanthology.org/2023.findings-acl.40.pdf

Skeleton of Thought: large language models can do parallel decoding

Un article sur une méthode de prompt engineering pour réduire la latence d'un LLM en découpant une tâche en sous tâche puis en générant chaque partie indépendamment avant de merge le tout.

L'article est pleins d'exemples concrets en annexes

c-ai · text-ai · prompt-engineering

November 21, 2023 at 23:26:47 UTC * · permalink

·

https://arxiv.org/pdf/2307.15337.pdf

Tree of Thoughts: Deliberate Problem Solving with Large Language Models

Un article sur la méthode du Tree of Thoughts pour résoudre des problèmes complexes avec un LLM.

Cet article a le mérite d'être compréhensible et de fournir des exemples concrets

c-ai · text-ai · prompt-engineering

November 21, 2023 at 23:21:56 UTC * · permalink

·

https://arxiv.org/pdf/2305.10601.pdf

CoT-Igniting-Agent

Toute une liste d'articles sur le Chain Of Thought

c-ai · text-ai · prompt-engineering

November 21, 2023 at 23:10:08 UTC * · permalink

·

https://github.com/Zoeyyao27/CoT-Igniting-Agent

OpenChat 3.5 basé sur Mistral est comparable à ChatGPT

OpenChat est une version fine tuné de Mistral 7B qui offre des performances comparable à ChatGPT (version de mars).

Il est aussi plus performant que le modèle Grok de X.com qui fait 30 milliards de paramètres contre 7 milliards pour Mistral.

Plus d'info ici https://twitter.com/baptistejamin/status/1726571942319460381

c-ai · text-ai

November 21, 2023 at 09:17:00 UTC * · permalink

·

https://huggingface.co/openchat/openchat_3.5

AI proxy: fostering a more open ecosystem

Une solution pour utiliser d'autres LLMs en conservant les mêmes API/SDK que pour OpenAI.

Mistral et Claude 2 sont disponibles simplement en changeant l'URL de OpenAI par celle du proxy.

Sous le capot ça utilise les Cloudflare Worker pour réduire la latence au maximum.

c-ai · text-ai · proxy

November 20, 2023 at 18:34:20 UTC * · permalink

·

https://www.braintrustdata.com/blog/ai-proxy

Lost in the Middle: How Language Models Use Long Contexts

Un article qui évalue la performance des LLMs en fonction de l'endroit ou sont les informations dans le prompt.

Avec des prompts de plus en plus long, les LLMs ont tendance à "perdre" de l'information car la complexité du mécanisme d'attention est fonction du carré de la taille du prompt.

Les chercheurs ont trouvé que les informations placées au début et à la fin avaient plus de chance d'être retrouvées/utilisées.

C'est ce qui est placé au début du prompt qui a le plus d'importance pour le LLM, puis ce qui est placé à la fin et tout ce qui est au milieu

c-ai · text-ai · prompt-engineering

November 19, 2023 at 23:30:06 UTC * · permalink

·

https://arxiv.org/pdf/2307.03172.pdf

Announcing Microsoft Copilot Studio

Microsoft lance aussi son service de création d'assistant à la "GPT" avec une intégration avec tous les outils Office 365.

c-ai · text-ai · assistant-ai

November 19, 2023 at 22:49:02 UTC * · permalink

·

https://www.microsoft.com/en-us/microsoft-365/blog/2023/11/15/announcing-microsoft-copilot-studio-customize-copilot-for-microsoft-365-and-build-your-own-standalone-copilots/

ishan0102/vimGPT: Browse the web with GPT-4V and Vimium

Une expérimentation de manipulation automatique du browser avec GPT-4V en renfort pour la compréhension des interfaces.

c-ai · text-ai · image-ai · navigateur · interface-manipulation

November 17, 2023 at 11:32:04 UTC * · permalink

·

https://github.com/ishan0102/vimGPT

Lindy.ai — Meet Your AI Employee

Un autre bot Agent LLM qui lui propose de réaliser des tâches comme le support.

c-ai · assistant-ai · text-ai

November 15, 2023 at 00:21:08 UTC * · permalink

·

https://www.lindy.ai/

Dust - Amplify your team's potential with customizable and secure AI assistants

Un bot Agent LLM qui centralise le savoir de l'entreprise

c-ai · text-ai · assistant-ai

November 15, 2023 at 00:14:44 UTC * · permalink

·

https://dust.tt/

Filtrable HNSW - Qdrant

Une explication détaillée de l'algorithme HNSW pour la recherche vectorielle.

J'ai beaucoup l'analogie utilisée par Qdrant avec un voyage.

Quand vous voyagez d'un petit village à un autre:

bus pour Lyon
train pour Paris
avion pour Berlin
train Hambourg
bus pour Lüneburg

Chaque étape utilise un moyen de transport ayant moins de hub et capable de faire de plus grandes distances

L'algorithme HNSW fonctionne selon ce principe, le plan vectoriel est découpé en couches. Plus on est dans une couche haute, moins il y a de vecteurs et plus les vecteurs sont éloignés les uns des autres.

Au fur et à mesure de la recherche, on va de plus en plus bas dans les couches jusqu'à arriver à la dernière et on peut donc récupérer tous les vecteurs les plus proches en un minimum d'opérations.

c-ai · text-ai · embeddings

November 11, 2023 at 18:44:46 UTC * · permalink

·

https://qdrant.tech/articles/filtrable-hnsw/