Rejoignez les newsletters quotidiens et hebdomadaires pour obtenir les dernières mises à jour et le contenu exclusif pour couvrir la principale intelligence artificielle de l’industrie. Apprendre encore plus
Bensanis Les chercheurs ont développé le système international Amnesty convertissant une image en vidéos réalistes de personnes qui parlent, chantent et se déplacent naturellement – une pénétration qui peut remodeler le divertissement et les communications numériques.
Le nouveau système est appelé SimulationIl génère des vidéos complètes du corps qui montrent que les gens se réfèrent et se déplacent de manière compatible avec leur discours, contournant les modèles d’intelligence artificielle précédents qui ne peuvent que stimuler les visages ou les corps supérieurs.
Comment Omnihuman utilise 18 700 heures de données de formation pour créer un mouvement réaliste
« L’animation humaine a vu d’une course pour mettre fin à des progrès remarquables ces dernières années », ont écrit des chercheurs des chercheurs ces dernières années. Document publié sur ArXIV. « Cependant, les méthodes actuelles ont encore du mal à étendre la gamme de grands modèles de génération de vidéos publics, ce qui limite leur potentiel dans des applications réelles ».
L’équipe a formé Omnihuman sur plus de 18 700 heures de données vidéo humaines en utilisant une nouvelle approche qui combine plusieurs types d’entrées – texte, son et corps. La stratégie de formation des «conditions célèbres» permet à l’agence du QI d’apprendre des ensembles de données plus grands et variés que les méthodes précédentes.
La pénétration de la vidéo de l’intelligence artificielle montre un mouvement complet du corps et des gestes naturels
« Notre vision principale est que la combinaison de plusieurs signaux de climatisation, tels que le texte, le son et la formation, pendant la formation peut réduire considérablement les déchets de données », a expliqué l’équipe de recherche.
Cette technologie est un grand progrès dans les médias créés à partir de l’intelligence artificielle, qui indique les possibilités allant de la création de vidéos pour les personnes qui présentent des lettres pour tirer des sujets jouant des instruments de musique. Dans le test, Omnihuman a surpassé les systèmes actuels à travers de multiples normes de qualité.
Les géants de la technologie se déroulent pour développer des systèmes vidéo de la prochaine génération d’intelligence artificielle
Le développement apparaît au milieu d’une concurrence intense dans la génération d’intelligence vidéo, avec des entreprises comme Googleet Mort et Microsoft Suivez -Um Techniques similaires. La pénétration de la pénétration peut donner rapidement à la mère Tiktok une fonctionnalité dans ce champ avancé.
Les experts de l’industrie affirment que cette technologie peut transformer la production de divertissement et créer du contenu éducatif et des communications numériques. Cependant, cela soulève également des préoccupations concernant la possible utilisation abusive de la création de médias artificiels à des fins trompeuses.
Les chercheurs présenteront leurs résultats lors d’une conférence provenant d’une vision informatique, bien qu’ils n’aient pas encore spécifié quand ou aucun.