БАКУ, 25 фев — Sputnik. Конкурентоспособную прикладную систему в области распознавания речи создали исследователи Института систем управления (ИСУ) Национальной академии наук Азербайджана (НАНА), сообщает отдел по связям с общественностью Академии.
Данные работы проведены в Институте в рамках совместной работы с частной компанией.
По результатам исследования, которое возглавляет доцент Абульфат Фатуллаев, с помощью машинного и углубленного обучения (Machine Learning, Deep learning) по ряду европейских языков (немецкий, английский, испанский, итальянский, французский) и азербайджанскому языку, разработаны нейросетевые модели и алгоритмы систем распознавания речи.
Большие данные (Big Data) и технологии распределенных вычислений широко используются для создания и обработки акустических, лингвистических и других баз данных, чтобы обеспечить нормальную работу моделей нейронных сетей. Следует отметить, что базы данных создавались полностью автоматизированным способом, терабайты информации отбирались с использованием ресурсов интернета.
Несмотря на то, что модели нейронных сетей, полученные в результате исследования, включают большое количество параметров, при их использовании ученые смогли проводить высокоскоростные вычисления, используя параллельные алгоритмы, разложение матриц и другие методы. Версии системы на английском, немецком, турецком и азербайджанском языках были созданы и доступны в интернете.
Применение распознавания речи в системе дистанционного обучения может облегчить аутентификацию студентов, особенно во время экзаменов. Применяя данные технологии, можно создавать специальные сервисы, отвечающие потребностям людей с ограниченными возможностями, предоставлять им образование.
Следует отметить, что согласно прогнозам развития информационных технологий, в ближайшие годы годовой объем мирового рынка систем распознавания речи и различных приложений (анализ речи, медиамониторинг, виртуальный помощник, идентификация диктора и другие) оценивается в 25 миллиардов долларов.