Au delà de ChatGPT et Dall-e, une liste d'outils pour diverses tâches
Meta annoncent un nouveau format de compression basé sur une méthode employant un réseau de neurones.
Ce format fait jusqu'à 10x mieux que MP3 avec des compressions entre 1.5 et 12 Kbp/s (64 Kbp/s en MP3)
La décompression peut se faire sur un simple core CPU ce qui pourrait en faire un format compatible smartphone.
Une AI de Microsoft qui fait du text-to-speech et elle est capable de reproduire n'importe quelle voix avec seulement 3 secondes d'enregistrement.
Une solution qui se targue de détecter l'usage de GPT-3 et ChatGPT.
J'ai pas réussi à essayer la version gratuite sur leur site.
En tout cas c'était à prévoir, et maintenant ça va être l'éternel jeu du chat et de la souris car il suffira aux algorithme d'IA de s'adapter aux algorithme de détection etc
HTTPie ont lancé un assistant IA pour intéragir avec les API.
En gros on tape un prompt en langage naturel et ça génère la bonne requête
Fetch last release details of httpie/desktop
une liste de prompt intéressants pour utiliser dans ChatGPT
CLIP Interrogator est une utilisation d'une IA pour générer un prompt à partir d'une photo.
Ensuite on peut utiliser ce prompt dans DALL-E ou autre pour générer une image qui ressemble à l'original
Un image upscaler basée sur une IA.
Ça permet d'augmenter la qualité d'une image
Un très bon article qui résume la situation actuel dans le monde des IA spécialisées dans le langage naturelle comme GPT3 et bien sur son accolyte ChatGPT.
Au délà de l'effet whaou (mérité!), l'auteur cite notamment 4 limites:
- pas de véritable compréhension des réponses par l'IA ce qui engendre des contresens, non-senses et autres incohérences
- pas de notion d'éthique
- difficulté de contextualisation, même dans le cadre d'un chatbot d'entreprise, ChatGPT se fera une joie de répondre à n'importe quelle question (sauf si on lui indique de ne pas le faire)
- le coût économique et écologique
Je pense qu'il y a d'autres choses à prendre en compte, typiquement si le contenu est généré par des IA (DALL-E et ChatGPT) alors ces mêmes IA s'entraineront sur ce contenu, ce qui entrainera potentiellement un affaiblissement des modèles (voir https://links.aschen.tech/shaare/40uSng)
La ville de Montpellier interdit la reconnaissance faciale.
Pour appuyer cette décision, la mairie a demander à ChatGPT des arguments en faveur de chaque camp puis à pris une décision en fonction des réponses.
Des mecs ont entrainé Stable Diffusion avec des images de spectrogramme musicaux.
Le résultat? Avec un prompt on génère un spectrogramme qui peut ensuite être converti en son.
funk bassline with a jazzy saxophone solo
Très intéressant point de vue de Ploum.
Si les IA s'entraînent avec ce qu'il y a sur internet et que leurs créations se retrouvent sur internet, elle vont continuer à s'entraîner avec leurs propres créations, ce qui conduira potentiellement à un affaiblissement de la pertinence des modèles.
Est-ce la fin des moteurs de recherche?
ChatGPT de OpenAI est capable de générer automatiquement des réponses à des questions complexes.
Les réponses sont parfois de meilleur qualité que celle que l'on peut trouver sur Google ou Stackoverflow.
Une IA qui améliore les performances d'une autre IA.
Une IA de Google a trouvé comment multiplier plus efficacement des matrices de nombres.
C'est une opération très commune dans les réseaux de neurones mais aussi dans les programmes graphiques.
Pour multiplier une matrice de 4x5 par une matrice de 5x5, le meilleure algorithme humain utilisait 80 multiplication et AlphaTensor (le nom de cette IA) a trouvé une méthode avec 76 multiplications!
(Merci Guillaume pour le partage)
Dans la même mouvance que Dall-E, Stable Diffusion et MidJourney, une IA pour générer des modèles 3D à partir de texte.
Une utilisation intéressante de Stable Diffusion pour compresser des images.
Stable Diffusion est un algorithme de génération d'image à partir d'un texte.
Après la génération d'image à partir d'un texte, maintenant Facebook propose la génération de vidéo à partir d'un texte
Un site qui permet de vendre des images générées par ordinateur, sauf qu'il ne vend pas les images mais le texte utilisé pour les générer! (le "prompt")
On parle de "prompt engineer" en parlant d'une personne qui manipule des IA pour générer des images à moindre coût.
Whoa ça c'est de l'avancée en IA qui claque!
Ils ont réussi à analyser les signaux cérébraux pour comprendre quels sont les mots qu'auraient voulu utiliser des personnes incapable de parler.
Les chercheurs arrivent à reconnaitre 793 mots à 73%.
Une IA de Google qui génère des images à partir de textes.
"A transparent sculpture of a duck made out of glass."
"A robot couple fine dining with Eiffel Tower in the background."