Search: [audio-ai] - Aschen | Sharing the webz

AI Text to Sound Effects Generator | ElevenLabs

ElevenLabs propose maintenant de générer des sons d'ambiance.

Ça peut être des bruitages comme des applaudissements mais aussi des voix avec un style particulier comme "voix d'une vieille dame en sanglot".

Bonne nouvelle pour le monde de la création de contenu audio-visuel !

c-ai · audio-ai

June 15, 2024 at 13:53:23 UTC * · permalink

·

https://elevenlabs.io/sound-effects

Bland AI Phone Calling Platform

Une IA qui appel et répond au téléphone.

C'est assez incroyable, on peut mettre son numéro de téléphone et l'IA nous appelle.

Je lui ait demandé ce qu'elle pensait de mon entreprise par exemple et on a eu une conversation sur le futur de e-learning.

c-ai · audio-ai

April 27, 2024 at 08:55:09 UTC * · permalink

·

https://www.bland.ai/

Navigating the Challenges and Opportunities of Synthetic Voices

OpenAI fait un peu de teasing sur son modèle de text-to-speech et le produit VoiceEngine qui permet de créer des voix à partir d'un court extrait audio.

Des boîtes comme Heygen auraient déjà accès à ce modèle.

Pour l'instant ce produit reste en usage restreint, notamment pour laisser le temps de remplacer les systèmes de sécurité basés sur la voix

c-ai · audio-ai

April 6, 2024 at 21:30:41 UTC * · permalink

·

https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

SeamlessStreaming, a realtime translation model

Le modèle SeamlessStreaming de chez Facebook est disponible en Open Source.

Il permet de faire de la traduction en temps réel d'une langue vers une autre (audio + texte).

Voir la vidéo de démo

c-ai · audio-ai · open-source

December 10, 2023 at 19:03:29 UTC * · permalink

·

https://github.com/facebookresearch/seamless_communication/blob/main/docs/streaming/README.md

Searching by music: Leveraging vector search for audio information retrieval

De la recherche vectorielle sur des fichiers audio avec Elasticsearch et librosa

c-ai · audio-ai · search-engine

December 4, 2023 at 18:53:02 UTC * · permalink

·

https://www.elastic.co/fr/blog/searching-by-music-leveraging-vector-search-audio-information-retrieval

Vaibhavs10/insanely-fast-whisper

Le nouveau modèle Text-to-Speech de OpenAI, Whisper Large v3, est capable de transcrire 2.5h d'audio en moins de 2 minutes

c-ai · audio-ai

November 22, 2023 at 20:12:10 UTC * · permalink

·

https://github.com/Vaibhavs10/insanely-fast-whisper

Google is embedding inaudible watermarks right into its AI generated music

Google ajoute un watermark inaudible dans les fichiers audio générés par son modèle Lyria.

c-ai · audio-ai

November 16, 2023 at 14:56:26 UTC * · permalink

·

https://www.theverge.com/2023/11/16/23963607/google-deepmind-synthid-audio-watermarks

Introducing PlayHT 2.0 Turbo ⚡️ - The Fastest Generative AI Text-to-Speech API

Une API de Text-to-Speech avec une latence très basse (300ms).

Ça veut dire que l'on peut envoyer du texte en streaming et recevoir de l'audio en streaming en pluguant GPT4 directement sur Turbo par exemple.

C'est la porte ouvertes aux conversations quasi temps réel (reste encore le Speech-to-Text et surtout l'envoi du prompt à GPT4 qu'il ne sera pas possible de streamer par contre)

c-ai · audio-ai

November 3, 2023 at 09:49:06 UTC * · permalink

·

https://news.play.ht/post/introducing-playht-2-0-turbo-the-fastest-generative-ai-text-to-speech-api

Chirp v1 Examples

Une IA générative qui génère du son depuis un prompt.

ça rend super bien, ils sont capable de générer des musiques entières avec des paroles et un genre précis genre "Upbeat EDM"

c-ai · audio-ai

September 24, 2023 at 13:46:43 UTC * · permalink

·

https://suno-ai.notion.site/Chirp-v1-Examples-cc71e6c0c79f4e03acf39aa5d5a3dd09

MusicLM by Google

Des réseaux de neurones de Google qui génèrent de l'audio à partir de prompt

c-ai · audio-ai · machine-learning

January 27, 2023 at 20:42:07 UTC * · permalink

·

https://google-research.github.io/seanet/musiclm/examples/