ЧЕЧНЯ. Старший преподаватель кафедры «Информатика и вычислительная техника» Института прикладных информационных технологий ГГНТУ Элиса Израилова последние несколько лет занимается исследованием в области речевых технологий.
Основная научно-практическая задача – моделирование системы синтеза чеченской речи на основе глубоких сверточных нейронных сетей.
Основной характеристикой систем искусственного интеллекта, к которым относятся современные программы синтеза и распознавания речи, является обучение на предварительно созданных текстовых и речевых базах данных. И от качества и объема этих баз данных, зависит качество речевого сигнала.
Была подготовлена небольшая экспериментальная база данных, состоящая из 5 часов речи, представленная в виде нескольких тысяч предложений, озвученных женским голосом. Затем запущено пробное обучение системы на подготовленной базе данных.
Эксперимент по машинному обучению был ориентирован как на положительный, так и на отрицательный результат, так как после обучения подобные системы могут выдавать как непонятные звуки, щелчки, свист, так и речь.
Результат превзошел ожидания - удалось синтезировать чеченскую речь! ⠀ Качество синтезируемой речи по предварительным оценкам среднее. Некоторые слова система еще плохо читает, не всегда правильно озвучиваются долгие и краткие гласные, голос системы – роботизированный, но на данном первоначальном этапе результат эксперимента является в большей мере положительным. ⠀
Разработчик проекта Элиса Израилова поблагодарила руководство ГГНТУ за содействие: эксперимент по машинному обучению системы удалось реализовать на базе современного оборудования в Хайпарке ГГНТУ.
Прослушать искусственный голос, говорящий на чеченском можно по ссылке.