Search: [c-ai] - Aschen | Sharing the webz

Twin - Never do the same thing twice

Un projet d'assistant IA capable de réaliser des tâches en manipulant les interfaces des sites web.

c-ai · assistant-ai · navigateur · interface-manipulation

February 22, 2024 at 13:25:39 UTC * · permalink

·

https://twin.so/

Air Canada Has to Honor a Refund Policy Its Chatbot Made Up

Un chatbot d'Air Canada s'est trompé en conseillant une procédure de remboursement rétro-active qui n'existait pas à un client.

Une court a jugé Air Canada responsable de ce que sont chatbot disait.

Moralité attention à ce qu'il sort des LLMs car vous pourrez être tenu responsable

c-ai · text-ai

February 18, 2024 at 16:08:34 UTC * · permalink

·

https://www.wired.com/story/air-canada-chatbot-refund-policy/

Marblism - Generate entire App

Un Agent capable de générer des applications entières avec frontend, backend et database.

Ils annoncent qu'il y aura des retouches manuelles à faire bien sur mais aussi qu'il est possible d'itérer avec un Agent sur chaque page.

Les pages doivent être déclarés avec toutes leurs Users Stories (As an User ....)

c-ai · code-ai

February 15, 2024 at 23:37:19 UTC * · permalink

·

https://dev.marblism.com/

Introducing Gemini 1.5, Google's next-generation AI model

Gemini 1.5 arrive avec une fenêtre de contexte jusqu'à 1 million de tokens !

Les performances restent très bonnes malgré la masse de tokens avec 99% de succès au problème de trouver une chaîne de caractère dans le prompt (Needle in a Haystack)

La latence et le prix d'un tel prompt va continuer à pousser les gens vers du RAG pour le moment mais c'est quand même une prouesse technique inimaginable il y a moins d'un an.

c-ai · text-ai

February 15, 2024 at 19:39:59 UTC * · permalink

·

https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/#performance

Sora - Text to video - OpenAI

Le nouveau modèle de OpenAI pour générer des vidéos.

Ça génère des vidéo de plus d'une minute quasiment sans artefact visible et avec un cohérence complètement maîtrisée entre les trames. C'est juste impressionnant.

Encore une fois OpenAI sort un modèle ayant plusieurs mois d'avance sur ses concurrents

c-ai · video-ai

February 15, 2024 at 19:09:48 UTC * · permalink

·

https://openai.com/sora

Self-Rewarding Language Models

Des recherches sur un modèle capable de s'entrainer lui même en se fournissant du feedback à lui même.

Ça me fait penser à de l'apprentissage non-supervisé mais appliqué aux LLMs

c-ai · text-ai

February 8, 2024 at 09:50:17 UTC * · permalink

·

https://huggingface.co/papers/2401.10020

Lumiere - Text to Video by Google

Lumiere c'est le nouveau modèle de Google pour générer des vidéos.

ça prend des prompt en entrée mais aussi du multi-modal avec image + prompt

c-ai · video-ai

February 3, 2024 at 17:59:48 UTC * · permalink

·

https://www.youtube.com/watch?v=wxLr02Dz2Sc

Researchers say generative AI isn't replacing devs any time soon | LeadDev

C'est ce qui se dessine après 1 an de GPT4, même si les LLMs sont impressionnant, le développement est une tâche tellement complexe que les développeurs ne sont pas près d'être remplacés.

En même temps vu la "fenêtre de contexte" qu'il faut gérer lorsqu'on maintient une application, ça ne m'étonne pas que les LLMs avec leur petite fenêtre de contexte assez imprécise ne soient pas capable de remplacer les développeurs.

Les LLMs continueront d'être des copilotes mais ils ne sont pas près d'être des pilotes.

c-ai · code-ai

January 30, 2024 at 22:14:59 UTC * · permalink

·

https://leaddev.com/tech/researchers-say-generative-ai-isnt-replacing-devs-any-time-soon

voyage-code-2: Elevate Your Code Retrieval

Voyage AI propose des modèles d'embeddings plus performants que ceux de OpenAI.

Ils sont premier du leaderboard MTEB avec leur modèle voyage-lite-02-instruct (67.13 vs 64.59 pour OpenAI), un benchmark qui mesure la performance de la recherche par embeddings.

Leur nouveau modèle d'embeddings, voyage-code-2, est meilleur que les précédents mais en plus à une fenêtre de contexte de 16K token!

Ce modèle est spécialisé pour le code mais offre aussi de très bonnes performances pour le texte normal

c-ai · text-ai · embeddings

January 28, 2024 at 20:26:52 UTC * · permalink

·

https://blog.voyageai.com/2024/01/23/voyage-code-2-elevate-your-code-retrieval/

New embedding models and API updates

OpenAI dévoile plusieurs nouveautés et particulièrement un nouveau modèle d'embeddings (ada2 datait de fin 2022).

Le modèle est décliné en deux versions:

text-embedding-3-small: 1536 dimensions, 62.3 MTEB
text-embedding-3-large: 3072 dimensions, 64.6 MTEB

Le modèle large est en 4è position du classement MTEB. (Ada2 était à 61 MTEB)

Le prix du small est 5x moins cher que Ada2 (0.00002$ 1K token) et le large est ~ le même prix (0.00013$ pour 1K token)

La fenêtre de contexte est toujours de 8196 token, ce qui est toujours peu par rapport à celle des embeddings VoyageAI (16K) ou même de GPT4

c-ai · text-ai · embeddings

January 28, 2024 at 20:22:04 UTC * · permalink

·

https://openai.com/blog/new-embedding-models-and-api-updates

Poisoned AI went rogue during training and couldn't be taught to behave again in 'legitimately scary' study | Live Science

Dee recherches menées sur l'exploitation des LLMs en tant que vecteur d'attaque.

Des techniques similaire à de l'obfuscation permettent d'apprendre au modèle à cacher ses intention malicieuse.

Par exemple durant les phases de validation, le code généré sera normal puis à partir d'une certaine date le code généré sera malicieux.

Cela peut aussi être déclenché par une instruction spéciale dans le prompt

c-ai · text-ai · cybersecurite

January 27, 2024 at 17:10:56 UTC * · permalink

·

https://www.livescience.com/technology/artificial-intelligence/legitimately-scary-anthropic-ai-poisoned-rogue-evil-couldnt-be-taught-how-to-behave-again

IA. Le bot du Pôle emploi autrichien refuse d’orienter les femmes vers l’informatique

Les biais des LLMs peuvent être très marqués et avoir des conséquences en fonction de l'utilisation faite du LLM.

c-ai · text-ai

January 24, 2024 at 14:49:53 UTC * · permalink

·

https://www.courrierinternational.com/article/ia-le-bot-du-pole-emploi-autrichien-refuse-d-orienter-les-femmes-vers-l-informatique?at_campaign=partage_article_app&at_medium=android

AlphaGeometry: An Olympiad-level AI system for geometry

Un modèle de type Transformers développé par Google pour résoudre des problèmes de géométrie.

Le modèle à résolu 25 problèmes sur 30, une personne ayant une médaille d'or en résout en moyenne 25.9.

c-ai · text-ai

January 22, 2024 at 09:05:10 UTC * · permalink

·

https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/

Code Generation with AlphaCodium: From Prompt Engineering to Flow Engineering

Une solution de génération de code qui s'inspire grandement de AlphaCode de Google.

Les problèmes sont des exercices de code (code contest), ce sont des problèmes d'algorithmie ayant peu de rapport avec le quotidien d'un développeur.

Fonctionnement:

génération de tests supplémentaires
génération de solutions possibles
exécution de chaque solution
correction éventuelle

C'est plus ou moins du bruteforce

c-ai · code-ai

January 19, 2024 at 11:55:26 UTC * · permalink

·

https://github.com/Codium-ai/AlphaCodium

A Guide to Large Language Model Abstractions

Un article très intéressant sur l'écosystème des LLMs.

Il parle notamment des 5 types de frameworks:

Open Ended (AutoGPT, AutoGen): résoudre des problèmes généraux et complexes de manière quasi autonome
- Compilation Driven (DSPy): génération de chaines de prompts à partir de schéma contraints sur les entrées et sorties
- Prompt Engineering Utils (Langchain, LlamaIndex): template de prompt, parsing, embeddings retrieval
- Schema Driven Generation (Langchain, LlamaIndex, Marvin): forcer la génération à respecter un schéma précis pour le parsing
- Controlled Generation (Outline, LMQL): contraindre le LLM à satisfaire un format et d'autres contraintes

c-ai · text-ai

January 19, 2024 at 11:51:35 UTC * · permalink

·

https://www.twosigma.com/articles/a-guide-to-large-language-model-abstractions/

5 cas d’usage de Chat GPT en Customer Success (+ Prompts associés)

Un excellent cas d'usage d'un LLM pour de la relation client.

Les 5 comportements qu'ils ont prévu:

rédiger une synthèse des échanges avec le client
résumer les feedbacks positifs émis par le client
faire émerger des problèmes récurrents
analyser le niveau d’implication des stakeholders
détecter des opportunités d’upsell

c-ai · text-ai

January 19, 2024 at 11:03:32 UTC * · permalink

·

https://www.skalin.io/blog/usage-chat-gpt-customer-success

Introducing Canopy: An easy, free, and flexible RAG framework powered by Pinecone | Pinecone

Pinecone propose un RAG sur étagère avec ingestion de données puis conversation en quelques commandes depuis un terminal.

Sous le capot ça va ingérer les données d'un répertoire dans Pinecone (embeddings OpenAI ou autre) et permettre de les utiliser dans un RAG conversationnel.

L'outil expose aussi un serveur d'API pour une intégration dans une application.

c-ai · retrieval-augmented-generation · text-ai

January 19, 2024 at 11:01:23 UTC * · permalink

·

https://www.pinecone.io/blog/canopy-rag-framework/