Мамаев Константин

Эксперты признали российскую технологию распознавания речи лучшей в мире

Эксперты признали российскую технологию распознавания речи лучшей в мире
Недавно стало известно, что технологию сегментирования аудиопотока и распознавания речи, которую создала отечественная группа компаний ЦРТ, эксперты признали наилучшей в мире. Сравнительный анализ проводился среди ряда международных разработок, созданных специалистами из РФ, США, Японии, Китая и других передовых в этом направлении стран.
Целевым конкурсным заданием был поиск решения для "проблемы коктейльной вечеринки". Так называется ситуация, в ходе которой речь ряда говорящих людей "смешивается" с шумом окружающей обстановки, то есть, таким образом, происходит имитация настоящего общественного мероприятия. Традиционно такой типичный набор вызывает затруднения у машинного интеллекта при распознавании речи говорящих, что, соответственно, тормозит развитие технологий в данном направлении. Со своей стороны, в разработке российские специалисты воспользовались алгоритмом отделения речевых сегментов для каждого из говорящих людей, создав таким образом комплекс, включающий несколько нейронных сетей. Такие сети имеют различную архитектуру и отличают слова разных дикторов благодаря бимформингу - эффекту нацеливания микрофонов на конкретного индивидуума.

Как сообщили представители пресс-службы ЦРТ, именно российская технология в итоге стала обладательницей наивысшей оценки при распознавании английской речи в приведенных условиях, первоклассно пройдя соответствующее тестирование. Кроме того, один из участников оргкомитета проводимого конкурса CHiME Challenge Джон Баркер отметил, что изначальной целью его проведения было обеспечение обмена опытом между сильнейшими командами со всего мира, а также продвижение вперед решения глобальных задач в сфере распознавания речи.

Подписывайтесь:




Добавить комментарий