| ДАЙДЖЕСТ: |

Как пишет TechXplore, доктор философии и автор исследования Пинчуань Ма и его коллеги смогли заставить искусственный интеллект распознавать речь на языках, отличных от английского, по движениям губ говорящих. Позже они сравнили производительность с другими моделями, обученными распознавать английскую речь.
Он также добавил, что главной инновацией является обучение модели выполнению VSR при добавлении нескольких дополнительных методов увеличения данных и функции потери.
«Мы добились самых современных результатов на нескольких языках благодаря тщательному проектированию модели, а не просто использованию больших наборов данных или больших моделей», - подчеркнул Ма.
По его словам, их работа может вдохновить других учёных на разработку альтернативных моделей VSR, которые смогут эффективно распознавать речь по движениям губ на языках, отличных от английского.
В планах Ма и его команды провести исследования по комбинированию моделей VSR с аудио-распознаванием речи.
![]() |
ВОЛГОГРАД. Триколор, VR и 65 паспортов: как Волгоград отметит День России
ЧЕЧНЯ. В Чечне расширят территорию пансионата для ветеранов до 280 мест к концу 2026 года
КАЛМЫКИЯ. В Калмыкии запустили медицинский чат для оперативной связи с медорганизациями
КАЛМЫКИЯ. Социальных работников Калмыкии поздравили с профессиональным праздником в Элисте
ЧЕЧНЯ. В Чечне вышел в свет новый сборник народных сказок тиражом 1000 экземпляров
АДЫГЕЯ. Мурат Кумпилов поблагодарил Росреестр за поддержку социально-экономического развития Адыгеи
КАЛМЫКИЯ. Новые сети водоснабжения помогут решить проблему слабого напора воды в Яшалте Калмыкии