Daily - November 21, 2023 - Aschen

Android in the Wild: A Large-Scale Dataset for Android Device Control

Whoa dans cet article les chercheurs ont réussi à manipuler l'interface d'Android avec un LLM.

C'est dans l'émulateur mais c'est quand même impressionnant, ils sont capable de faire des tâches assez complexes comme vider l'historique de navigation de Chrome ou faire des recherches Google

c-ai text-ai android interface-manipulation

Recursion of Thought: A Divide-and-Conquer Approach to Multi-Context Reasoning with Language Models

Dans cet article, les auteurs proposent une autre manière de découper une tâche en sous tâche en permettant au LLM de "créer" une sous tâche en écrivant un token spécial.

La sous tâche est ensuite executé par un LLM "enfant" puis le résultat est ré-incorporé dans la tâche principale.

L'article contient de nombreux exemples.

c-ai text-ai prompt-engineering

CoT-Igniting-Agent

Toute une liste d'articles sur le Chain Of Thought

c-ai text-ai prompt-engineering

An open platform for training, serving, and evaluating large language model for tool learning.

Un modèle entrainé depuis LlaMa 2 qui est spécialisé dans l'utilisation d'outils, notamment d'API tierces.

C'est une alternative Open Source à OpenAI et ses assistants

c-ai text-ai assistant-ai

Skeleton of Thought: large language models can do parallel decoding

Un article sur une méthode de prompt engineering pour réduire la latence d'un LLM en découpant une tâche en sous tâche puis en générant chaque partie indépendamment avant de merge le tout.

L'article est pleins d'exemples concrets en annexes

c-ai text-ai prompt-engineering

programming war crimes 4 video

Qu'est-ce qu'on rigole 😁

c-troll video

Verify-and-Edit: A Knowledge-Enhanced Chain-of-Thought Framework

Un article sur une méthode permettant d'améliorer la qualité des réponses dans un RAG.

Ils proposent notamment une méthode de prompting pour savoir quand il n'y a pas suffisament d'informations pour répondre:

Determine if there is Observation that SUPPORTS
or REFUTES a Claim, or if there is NOT ENOUGH
INFO.

Claim: The Gadsden flag was named by Christo-
pher Gadsden.

A: First, The Gadsden flag is named after politician
Christopher Gadsden. Second, there is no informa-
tion on who named the Gadsden flag. The answer
is NOT ENOUGH INFO.

c-ai text-ai prompt-engineering

Tree of Thoughts: Deliberate Problem Solving with Large Language Models

Un article sur la méthode du Tree of Thoughts pour résoudre des problèmes complexes avec un LLM.

Cet article a le mérite d'être compréhensible et de fournir des exemples concrets

c-ai text-ai prompt-engineering

OpenChat 3.5 basé sur Mistral est comparable à ChatGPT

OpenChat est une version fine tuné de Mistral 7B qui offre des performances comparable à ChatGPT (version de mars).

Il est aussi plus performant que le modèle Grok de X.com qui fait 30 milliards de paramètres contre 7 milliards pour Mistral.

Plus d'info ici https://twitter.com/baptistejamin/status/1726571942319460381

c-ai text-ai

Daily Shaarli

November 21, 2023