ДАЙДЖЕСТ: |
«Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», - пояснил руководитель группы разработчиков Линьжуй Тянь.
В основе работы EMO лежит технология диффузионных моделей ИИ, способная создавать реалистичные визуальные образы. Разработчики обучили систему на большом объеме данных, включающих более 250 часов записей «говорящих голов»: выступлений, фрагментов кино, телешоу и музыкальных клипов.
Microsoft создала искусственный интеллект для финансистов.
Автор: Дмитрий Иванов
Новостей нет
![]() |
Впервые за 36 лет: в Узбекистане готовятся к масштабной переписи населения в 2026 году
Речь Армена Геворгяна в ПАСЕ: Любой мир не имеет смысла, пока есть пленные