ДАЙДЖЕСТ: |
Как пишет TechXplore, доктор философии и автор исследования Пинчуань Ма и его коллеги смогли заставить искусственный интеллект распознавать речь на языках, отличных от английского, по движениям губ говорящих. Позже они сравнили производительность с другими моделями, обученными распознавать английскую речь.
Он также добавил, что главной инновацией является обучение модели выполнению VSR при добавлении нескольких дополнительных методов увеличения данных и функции потери.
«Мы добились самых современных результатов на нескольких языках благодаря тщательному проектированию модели, а не просто использованию больших наборов данных или больших моделей», - подчеркнул Ма.
По его словам, их работа может вдохновить других учёных на разработку альтернативных моделей VSR, которые смогут эффективно распознавать речь по движениям губ на языках, отличных от английского.
В планах Ма и его команды провести исследования по комбинированию моделей VSR с аудио-распознаванием речи.
![]() |
ЧЕЧНЯ. Новый офис Сбера открылся в селе Знаменское Чеченской Республики.
ВОЛГОГРАД. В Волго-Ахтубинскую пойму до засухи вольют почти 2 млн кубов воды
Россельхознадзор может ввести ограничения на цветы из Армении с 16 июня
РЖД строят цифрового путеводителя: к 2027 году появится онлайн-конструктор туров под ключ!
"РЖД объявляют цифровую независимость: к 2030 году — без западного ПО!"
СЕВАСТОПОЛЬ. Севастопольские школьники прошли через огонь ЕГЭ — кто теперь поступит?
Иран не собирается идти навстречу пантюркистским программам Эрдогана и Алиева
Иран жестко раскритиковал последний доклад МАГАТЭ, обвинив его в политизированности