В ГГНТУ им. Миллионщикова разработана первая система синтеза чеченской речи
Основной характеристикой систем искусственного интеллекта, к которым относятся современные программы синтеза и распознавания речи, является обучение на предварительно созданных текстовых и речевых базах данных. И от качества и объема этих баз данных, зависит качество речевого сигнала. В ГГНТУ была подготовлена небольшая экспериментальная база данных, состоящая из 5 часов речи, представленная в виде нескольких тысяч предложений, озвученных женским голосом. Затем запущено пробное обучение системы на подготовленной базе данных.
⠀
Эксперимент по машинному обучению был ориентирован как на положительный, так и на отрицательный результат, так как после обучения подобные системы могут выдавать как непонятные звуки, щелчки, свист, так и речь.
«Результат превзошел ожидания - удалось синтезировать чеченскую речь», - сказал министр.
Качество синтезируемой речи по предварительным оценкам среднее. Некоторые слова система еще плохо читает, не всегда правильно озвучиваются долгие и краткие гласные, голос системы – роботизированный, но на данном первоначальном этапе результат эксперимента является в большей мере положительным.