Search: [c-ai] - Aschen | Sharing the webz

OpenAI: Impossible to train top-tier AI and avoid copyright

La bataille juridique continue pour la rétribution des créateurs de contenu (visuel ou textuel) qui est ensuite utilisé pour entrainer des IA.

En gros OpenAI demande une exception pour l'entrainement des modèles d'IA même si ceux-ci sont capables de reproduire des scènes ou textes sous droits d'auteurs.

c-ai · copyright

January 10, 2024 at 15:01:25 UTC * · permalink

·

https://www.theregister.com/2024/01/08/midjourney_openai_copyright/

PlugBear: Plug your AI to the world

Un outil qui permet de brancher des LLM (Assistant GPT, LLM custom, etc) à des interfaces comme Slack ou Discord.

C'est parfait pour essayer rapidement d'intégrer des Assistant dans des process d'entreprise par exemple.

c-ai · text-ai

January 9, 2024 at 14:44:57 UTC * · permalink

·

https://plugbear.io/

GroqChat - Fastest inference Engine

Groq propose une technologie pour accélérer la vitesse d'inférence des LLMs.

Le résultat est impressionnant, ils arrivent à générer plus de 300 tokens/seconde avec Llama 2 70B.

Il faut 8 GPU A100 à 30$ de l'heure chez Amazon pour arriver au même résultat
la génération est de 35 tokens/seconde sur le GPU d'un particulier (Nvidia 4090)

Le moteur qu'il utilise s'appelle Groq LPU. Je suppose qu'ils utilisent la quantization et d'autres techniques comme PowerInfer

Ils développent aussi leur propre hardware, ce sont des puces spécialisés dans l'inférence.

Les opérations couteuses comme les multiplications de matrice sont gravés directement dans le silicium ce qui multiplie la vitesse par plusieurs ordres de grandeur.

Après les TPU de Google et les NPU de Microsoft, Groq propose une alternative hardware crédible sur un marché très dur à adresser.

c-ai · text-ai · performance · micro-processeur

January 6, 2024 at 11:09:44 UTC * · permalink

·

https://chat.groq.com/

Inflection - Pi

Un LLM qui met l'accent sur la qualité de la conversation de la même manière qu'un humain.

Notamment il va très souvent relancer l'utilisateur avec des questions pour explorer en profondeur les sujets proposés.

c-ai · text-ai

January 6, 2024 at 09:37:30 UTC * · permalink

·

https://inflection.ai/

Building RAG-based LLM Applications for Production

Un article très technique sur la création d'un RAG.

L'auteur explore notamment plusieurs techniques pour le chunking sur la taille des chunks, le nombre de chunks retrouvés avec des métriques de qualité.

c-ai · retrieval-augmented-generation

January 5, 2024 at 08:25:10 UTC * · permalink

·

https://www.anyscale.com/blog/a-comprehensive-guide-for-building-rag-based-llm-applications-part-1

How to Build a Knowledge Assistant at Scale

Un article sur l'architecture d'un RAG qui revient en détails sur les 4 composants principaux:

data layer: ingestion des données et contrôle d'accès
LLM layer: génération de la réponse augmentée
reporting layer: monitoring et statistiques d'utilisation du RAG
application layer: API et interfaces utilisateur

c-ai · retrieval-augmented-generation · tech-lead

January 5, 2024 at 08:23:18 UTC * · permalink

·

https://mlops.community/how-to-build-a-knowledge-assistant-at-scale/

awesome-ai-agents: A list of AI autonomous agents

Une awesome liste autour des Agents LLM

c-ai · assistant-ai

January 4, 2024 at 16:14:21 UTC * · permalink

·

https://github.com/e2b-dev/awesome-ai-agents

Tusk | AI Engineer for Your Product Team

Un autre Agent capable d'écrire du code frontend simple.

Ils proposent un système de ticketing ou des product manager peuvent décrire leurs tickets pour qu'ils soient réalisés par les Agents.

c-ai · code-ai

January 4, 2024 at 16:13:25 UTC * · permalink

·

https://usetusk.ai/

kapa.ai - ChatGPT for your developer-facing product

Un autre outil de RAG pour la documentation orienté développeurs.

C'est utilisable autant pour les questions internes d'une équipe sur son produit que par des développeurs externes intégrant des API.

c-ai · retrieval-augmented-generation · text-ai

January 4, 2024 at 12:07:11 UTC * · permalink

·

https://www.kapa.ai/

Inkeep - Answer developer questions, instantly.

Un RAG de recherche dans une documentation.

Ça permet de faire une recherche "instantanée" comme avec Algolia par exemple mais aussi un RAG avec réponse en langage naturel à partir des sources/

c-ai · retrieval-augmented-generation · text-ai

January 4, 2024 at 12:03:36 UTC * · permalink

·

https://inkeep.com/

CrewAI - a framework for orchestrating role-playing, autonomous AI agents.

Un framework un Python qui permet de définir plusieurs Agents puis de leur demander de se coordonner pour résoudre une tâche.

Ils ont notamment une démo assez avancée de génération de landing page avec GPT4 https://github.com/joaomdmoura/crewAI-examples/tree/main/landing_page_generator

c-ai · assistant-ai

January 4, 2024 at 11:11:32 UTC * · permalink

·

https://github.com/joaomdmoura/crewAI

OpenVoice: Instant voice cloning by MyShell.

Un modèle de génération de voix capable de cloner les voix.

c-ai · voice-ai

January 4, 2024 at 11:09:26 UTC * · permalink

·

https://github.com/myshell-ai/OpenVoice

Big translators layoff at Duolingo

Duolingo a viré la plupart de ses traducteurs car ils utilisent maintenant GPT4.

Le métier de traducteur est en grosse difficulté face aux avancées de la traduction automatique.

Il faut entre 2 et 10 fois moins de personnes pour relire les traductions de l'IA.

De plus en plus de grosses boites traduisent tout leur contenu dans des dizaines de langues sans faire relire par des humains. Github et Microsoft font ça pour toute leur documentation technique par exemple

c-ai

January 4, 2024 at 08:26:38 UTC * · permalink

·

https://www.reddit.com/r/duolingo/comments/18sx06i/big_layoff_at_duolingo/

AppAgent: Multimodal Agents as Smartphone Users, an LLM-based multimodal agent framework designed to operate smartphone apps.

Un Agent capable de manipuler les interfaces graphiques d'un smartphone Android.

Ils utilisent GPT4 pour la réflexion et GPT4V pour la reconnaissance d'image. En connectant l'Agent à un smartphone avec ADB, ils sont capable d'exécuter des actions de clique ou de swipe.

L'Agent inclue un mode "exploration" ou il va interagir en autonomie avec l'application afin de découvrir les fonctionnalités.

Cela ouvre beaucoup de nouvelles possibilités, notamment autour du testing des applications Android.

c-ai · assistant-ai · smartphone · interface-manipulation

January 4, 2024 at 07:57:35 UTC * · permalink

·

https://github.com/mnotgod96/AppAgent

Sweep: turn bugs and feature requests into code changes.

Un Agent LLM qui est capable d'exécuter de petites fonctionnalités dans une codebase.

c-ai · code-ai

January 3, 2024 at 20:39:08 UTC * · permalink

·

https://sweep.dev/

E2B: Cloud Runtime for AI Agents

Un runtime qui permet d'exécuter du code de manière sécurisé dans une sandbox.

Le projet a été pensé pour exécuter le code en provenance d'Agents LLM.

c-ai · code-ai

January 3, 2024 at 16:49:28 UTC * · permalink

·

https://github.com/e2b-dev/E2B

Kudurru - Block AI Scrapers

Un service qui permet de bloquer les scrappers IA qui ne respecteraient pas les conditions d'un site.

Leur liste d'IP est dynamique en fonction des scrappers potentiels qui sont entrain de collecter des données à un instant T.

On peut bloquer la requête ou renvoyer une autre image pour perturber l'entrainement des modèles.

c-ai · image-ai

January 2, 2024 at 22:29:46 UTC * · permalink

·

https://kudurru.ai/

CogVLM: a state-of-the-art-level open visual language model

CogVLM est un modèle de reconnaissance d'image spécialisé dans la reconnaissance et la navigation dans des interfaces graphiques.

Il a été entrainé sur des interfaces web mais aussi mobile.

Je dois dire que je suis assez impressionné par la qualité du modèle et surtout par sa rapidité!

Une démo est disponible ici http://36.103.203.44:7861/

c-ai · image-ai · interface-manipulation

January 2, 2024 at 20:01:03 UTC * · permalink

·

https://github.com/THUDM/CogVLM

AI Stylist - Amazon Bedrock Demo

Une démo impressionnante sur ce que pourrais être les interfaces de demain.

Depuis une vingtaine d'années, les interfaces hommes machines sont des écrans avec formulaires (grosso modo).

Les IA génératives permettent de rebattre les cartes et d'offrir une interface en langage naturelle enrichie avec des images.

c-ai · image-ai

December 28, 2023 at 16:49:20 UTC * · permalink

·

https://aistylist.awsplayer.com/

Reflexion: Language Agents with Verbal Reinforcement Learning

Une technique pour l'orchestration d'Agent qui obtient de bien meilleurs résultats de ReAct. (0.97 vs 0.76 sur HotPotQA)

Leur technique se base sur la réflexion autour du résultat obtenu par un premier LLM. Cette réflexion permet d'itérer sur la tâche à réaliser en corrigeant les erreurs.

L'étape de réflexion prend en compte la génération et un feedback sur cette génération. Le feedback dépend du type de problème:

question/réponse: évaluation par un LLM
génération de code: exécution du code et message d'erreur
prise de décision: vérification avec l'arbre des "bonnes" décisions

Une mémoire est également analysée pendant la phase de réflexion afin d'éviter le bouclage sur des solutions déjà essayées.

Cela me fait beaucoup pensé à cet article sur les Agent autonomes dans un jeu vidéo https://links.aschen.tech/shaare/a0Krew

c-ai · assistant-ai

December 28, 2023 at 10:08:21 UTC * · permalink

·

https://arxiv.org/pdf/2303.11366.pdf