Search: [c-ai] - Aschen | Sharing the webz

FreeAskInternet is a completely free, private and locally running search aggregator & answer generate using LLM

Un projet qui propose une interface de recherche à la Perplexity en local et 100% gratuit en se basant sur l'API publique de ChatGPT.

En gros ça permet de répondre à vos questions en agrégeant les résultats des moteurs de recherche comme un RAG

c-ai · text-ai

April 9, 2024 at 09:42:01 UTC * · permalink

·

https://github.com/nashsu/FreeAskInternet

karpathy/llm.c: LLM training in simple, raw C/CUDA

Une implémentation de GPT2 en 1000 lignes de code C.

Karpathy cherche à dénoncer la complexité de l'écosystème de machine learning en général avec des centaines de Mo (!) de code Python à télécharger pour faire tourner le moindre programme d'IA.

c-ai · machine-learning

April 8, 2024 at 20:45:18 UTC * · permalink

·

https://github.com/karpathy/llm.c

L’IA Générative au service de la pédagogie

Un article que j'ai écrit sur l'utilisation des LLMs chez Didask et plus généralement sur la manière dont on peut donner des instructions précises à des LLMs pour en faire des experts capables d'exécuter des tâches précises.

Je parle aussi de quelques unes de nos techniques de Prompt Engineering :-)

c-ai · text-ai

April 8, 2024 at 13:41:03 UTC * · permalink

·

https://www.didask.com/post/au-dela-de-chatgpt-lia-generative-au-service-de-la-pedagogie

huggingface/text-generation-inference: Revert license to Apache 2.0

Huggingface passe son moteur d'inférence texte en Apache 2.

C'est une excellente nouvelle car c'est cette techno qui fait tourner HuggingFace.

Ça permet de servir des modèles à travers une API. C'est un Python et en Rust et de gros efforts ont été fait sur la scalabilité.

Cela permet à tout le monde de déployer un système d'inférence robuste au sein de son infrastructure.

c-ai · text-ai

April 8, 2024 at 13:39:51 UTC * · permalink

·

https://github.com/huggingface/text-generation-inference/pull/1714

Une bulle d’intelligence artificielle et de stupidité naturelle

Un avis critique de Ploum sur la GenAI.

Je suis au moins d'accord sur le fait qu'il y a belle et bien une bulle. On a vu par exemple Stability AI qui n'a plus d'argent pour payer ses factures de cloud et il y a beaucoup d'entreprises qui ont de la même manière "cramé" l'argent des VCs sans avoir de business modèle.

c-ai

April 8, 2024 at 13:35:51 UTC * · permalink

·

https://ploum.net/2024-04-04-la-bulle-ai.html

Bases de données vectorielles: chronique d'une mort annoncée

Un article que j'ai écrit pour parler de la hype autour des bases de données vectorielles et de pourquoi il vaut mieux utiliser une base de données classique avec fonctionnalité de recherche vectorielle comme Elasticsearch ou Postgres.

c-ai · retrieval-augmented-generation · database

April 7, 2024 at 19:46:03 UTC * · permalink

·

https://gen-ai.fr/large-language-model/bases-de-donnees-vectorielles-chronique-dune-mort-annoncee/

GitHub’s latest AI tool can automatically fix code vulnerabilities

Github va un peu plus loin dans la génération de code en proposant un service de correction automatique des vulnérabilités détectées dans les repository.

Sous le capot c'est du GPT4 qui propose une modification d'une PR pour fix une potentielle faille de sécurité.

A priori ça reste des choses assez simple et cantonnées à un seul endroit comme échapper du HTML, éviter un prototype polution, etc

Pour l'instant, les failles sont détectées par des outils conventionnels et corrigé par GPT4 mais plus tard elles pourront aussi être détectés par GPT4

c-ai · code-ai

April 7, 2024 at 13:57:37 UTC * · permalink

·

https://techcrunch.com/2024/03/20/githubs-latest-ai-tool-that-can-automatically-fix-code-vulnerabilities/?guccounter=1

Perplexity, Copilot, You.com: Putting the AI search engines to the test

Les moteurs de recherche ne sont pas prêt de disparaitre.

Outre la différence phénoménal de coût entre une requête Google et une génération, il faut aussi se rappeler que beaucoup de requêtes sont de la navigation ("youtube" pour aller sur https://youtube.com) ou de l'information temps réel comme "météo montpellier".

c-ai

April 7, 2024 at 13:54:31 UTC * · permalink

·

https://www.theverge.com/24111326/ai-search-perplexity-copilot-you-google-review

princeton-nlp/SWE-agent: SWE-agent takes a GitHub issue and tries to automatically fix it, using GPT-4, or your LM of choice. It solves 12.29% of bugs in the SWE-bench evaluation set and takes just 1.5 minutes to run.

Un Agent Open Source comme Devin qui est capable de résoudre des issues Github.

Sur SWE-Bench, ils sont à 12.29 vs 13.84 (Devin, SOTA)

On est pas encore au niveau d'un développeur junior mais ça progresse.

c-ai · code-ai

April 7, 2024 at 13:53:05 UTC * · permalink

·

https://github.com/princeton-nlp/SWE-agent

JetMoE: Reaching LLaMA2 Performance with 0.1M Dollar

Le coût d'entrainement des LLMs a drastiquement baissé en seulement quelques mois.

JetMoE offre des performances similaires à Llama 2 mais avec un coût d'entrainement de seulement 100 000$ vs 5 000 000$ pour Llama 2.

c-ai · text-ai · training-ai

April 7, 2024 at 13:48:58 UTC * · permalink

·

https://research.myshell.ai/jetmoe

Long-context LLMs Struggle with Long In-context Learning

Une étude sur les performances des LLMs sur de longs contexte.

Même si les LLMs supportent des contextes très long maintenant, ce n'est pas un secret que plus il y a de token et moins le LLM est performant.

Dans leur benchmark, GPT4-Turbo s'en sort mieux que les autres mais ils n'ont pas testé Claude 3 ou Gemini 1.5.

Dans un autre benchmark, Gemini 1.5 arrivait à de meilleurs résultats que GPT4-Turbo avec un très long contexte

Ils ont créé un benchmark pour continuer à analyser les performances des LLMs sur de long contextes: LongICLBench

c-ai · text-ai

April 7, 2024 at 13:46:19 UTC * · permalink

·

https://arxiv.org/pdf/2404.02060.pdf

Navigating the Challenges and Opportunities of Synthetic Voices

OpenAI fait un peu de teasing sur son modèle de text-to-speech et le produit VoiceEngine qui permet de créer des voix à partir d'un court extrait audio.

Des boîtes comme Heygen auraient déjà accès à ce modèle.

Pour l'instant ce produit reste en usage restreint, notamment pour laisser le temps de remplacer les systèmes de sécurité basés sur la voix

c-ai · audio-ai

April 6, 2024 at 21:30:41 UTC * · permalink

·

https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

NVIDIA ChatRTX

Nvidia se fait de la pub en lançant une application de RAG locale qui utilise un de ses GPU pour fonctionner.

Sous le capot c'est Llama 2 et une simple DB vectorielle (Faiss).

Bref, plus une démo marketing qu'un vrai produit :-)

c-ai · text-ai · retrieval-augmented-generation

April 6, 2024 at 21:25:40 UTC * · permalink

·

https://www.nvidia.com/en-us/ai-on-rtx/chatrtx/

I've put a complex codebase into a single 120K-token prompt, and asked 7 questions GPT-4 and Gemini 1.5. Here are the results! : singularity

A priori le modèle Gemini de Google s'en sort beaucoup mieux sur des prompts long.

Ici l'auteur pose des question avec la totalité de sa code base dans les 120K tokens du prompt

c-ai · text-ai

April 3, 2024 at 12:29:33 UTC * · permalink

·

https://old.reddit.com/r/singularity/comments/1atjz9v/ive_put_a_complex_codebase_into_a_single/

Stability AI reportedly ran out of cash to pay its AWS bills

Stability AI n'a plus d'argent pour payer ses factures de cloud de presque 100 millions de dollars avec seulement 11 millions de revenus.

Dans les prochains mois, je pense que de nombreux fournisseurs de cloud IA vont suivre le même chemin vu que beaucoup on eu la même tactique en cassant les prix pour attirer des utilisateurs.

c-ai · image-ai · cloud

April 3, 2024 at 10:33:20 UTC * · permalink

·

https://www.theregister.com/2024/04/03/stability_ai_bills/

AutoRFP.ai Pricing

Un Agent LLM qui aide à répondre automatiquement aux questionnaires des grandes entreprises quand on leur vend des solutions SaaS par exemple

c-ai · text-ai

April 2, 2024 at 08:39:07 UTC * · permalink

·

https://autorfp.ai/pricing

Devin, IA software engineer

Un Agent semi autonome capable de réaliser des tâches sur des codebases complexes.

Ses capacités d'adaptation à de nouvelles technologies semblent impressionnante, à voir si ça se confirme autrement que dans des vidéos.

Il obtient plus de 13% sur le SWE benchmark qui évalue les Agents sur des tâches de programmation. C'est moi devant le Claude 2 qui était devant jusqu'ici avec 4%

c-ai · code-ai · assistant-ai

March 13, 2024 at 08:54:12 UTC * · permalink

·

https://www.cognition-labs.com/blog