| ДАЙДЖЕСТ: |

Как пишет TechXplore, доктор философии и автор исследования Пинчуань Ма и его коллеги смогли заставить искусственный интеллект распознавать речь на языках, отличных от английского, по движениям губ говорящих. Позже они сравнили производительность с другими моделями, обученными распознавать английскую речь.
Он также добавил, что главной инновацией является обучение модели выполнению VSR при добавлении нескольких дополнительных методов увеличения данных и функции потери.
«Мы добились самых современных результатов на нескольких языках благодаря тщательному проектированию модели, а не просто использованию больших наборов данных или больших моделей», - подчеркнул Ма.
По его словам, их работа может вдохновить других учёных на разработку альтернативных моделей VSR, которые смогут эффективно распознавать речь по движениям губ на языках, отличных от английского.
В планах Ма и его команды провести исследования по комбинированию моделей VSR с аудио-распознаванием речи.
![]() |
АЗЕРБАЙДЖАН. Энергетические проекты обсудили главы Минэнерго Азербайджана и Турции
АЗЕРБАЙДЖАН. В Грузии отметили роль визита Ильхама Алиева для развития энергетики страны
АЗЕРБАЙДЖАН. Названы объемы грузоперевозок по МТК в Азербайджане в этом году
АЗЕРБАЙДЖАН. Возрождение поезда Баку-Тбилиси-Баку очень важно для Грузии – Квривишвили
Воздухоохладители для холодильных камер: как сохранить свежесть без компромиссов
Услуги по демонтажу и монтажу складских стеллажей для безопасной работы склада
ЧЕЧНЯ. 1909 г. Чеченский шейх Шептукаев предложил чеченским представителям выбрать депутатов