Search: [video-ai] - Aschen | Sharing the webz

https://omnihuman-lab.github.io/

Bytedance (TikTok) ont sorti un modèle de génération de vidéo spécialisé dans la génération de personnes.

Depuis une image, un enregistrement audio, une vidéo sans audio ou une combinaison des deux, ils peuvent générer des vidéos entières quasiment sans artefacts (hallucinations).

Le modèle est privé pour le moment.

c-ai · video-ai

February 5, 2025 at 10:21:02 UTC * · permalink

·

https://omnihuman-lab.github.io/

Luma Dream Machine

Luma AI sort un modèle de génération vidéo d'une qualité comparable à Sora de OpenAI.

Il reste encore des limitations, notamment sur la représentation du mouvement, des objets qui changent entre les frames ou la difficulté à représenter du texte mais le résultat est déjà de très bonne qualité !

La course aux modèles de génération vidéo semble être lancée mais j'ai l'intuition qu'il y aura beaucoup moins de participants que pour le texte ou l'image car les coûts d'entraînement GPU de ces modèles vidéo sont exorbitants

c-ai · video-ai

June 12, 2024 at 21:06:52 UTC * · permalink

·

https://lumalabs.ai/dream-machine

VASA-1 - Microsoft Research

Un modèle d'IA capable de réaliser des clips vidéos de têtes de personnes en incluant des mouvements avancés du visage comme des émotions.

En entrée, il lui suffit d'une image et d'un clip audio.

Impressionnant et en même temps ça fait peur pour les deepfakes

c-ai · video-ai

April 18, 2024 at 12:11:13 UTC * · permalink

·

https://www.microsoft.com/en-us/research/project/vasa-1/

Open-Sora-Plan: This project aim to reproduce Sora (Open AI T2V model)

Un modèle open source de Text to Video.

Pour l'instant les vidéos générées sont soit courtes en 1024 (<3sec), soit plus longues en 512 (<10sec)

La cohérence de génération n'est pas parfaite non plus mais c'est un bon début!

L'avantage de ce genre de modèle Open Source c'est que la génération offrira beaucoup plus de contrôle qu'avec les modèles "API only" comme Sora.

c-ai · video-ai · open-source

April 9, 2024 at 20:05:19 UTC * · permalink

·

https://github.com/PKU-YuanGroup/Open-Sora-Plan

SadTalker: Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking Face Animation

Un modèle d'animation des lèvres.

c-ai · video-ai

March 12, 2024 at 18:30:13 UTC * · permalink

·

https://sadtalker.github.io/

Sora - Text to video - OpenAI

Le nouveau modèle de OpenAI pour générer des vidéos.

Ça génère des vidéo de plus d'une minute quasiment sans artefact visible et avec un cohérence complètement maîtrisée entre les trames. C'est juste impressionnant.

Encore une fois OpenAI sort un modèle ayant plusieurs mois d'avance sur ses concurrents

c-ai · video-ai

February 15, 2024 at 19:09:48 UTC * · permalink

·

https://openai.com/sora