Наносемантика в ТОП-15 российских компаний в области обработки естественного языка, распознавания и синтеза речи

Всего просмотров: 544

Недавно был выпущен второй выпуск альманаха “Искусственный интеллект” — регулярного аналитического сборника материалов, исследующих текущее состояние области искусственного интеллекта в России и в мире. Ведущими экспертами и аналитиками в Альманахе были описаны ключевые ИИ-технологии, примеры их применения, ключевые компании, университеты и люди в этой отрасли. Также в список ключевых компаний России, специализирующихся на обработке естественного языка, диалоговых системах, распознавании и синтезе речи, была включена Наносемантика. 

Об Альманахе “Искусственный интеллект”

Альманах выпускает Центр компетенций НТИ на базе МФТИ по направлению «Искусственный интеллект», который был создан в 2017 году как часть реализации программы Национальная технологическая инициатива. Центр способствует развитию ИИ-технологий и их использованию в различных областях экономики.

Главные аналитики проекта — Игорь Пивоваров, который также является организатором открытой конференции по искусственному интеллекту, OpenTalks.AI, и Наталия Гутенева, также организатор OpenTalks.AI и секретарь AI think tank

На сайте Альманаха можно скачать электронную версию, а также подать заявку на получение печатного издания.

Основные положения

Авторы Альманаха представили краткую сводку истории NLP (обработки естественного языка) и речевых технологий. Согласно исследованию, способность и обучение машин пониманию естественного человеческого языка остаётся в фокусе последующих разработок, связанных с ИИ. Этому посвящена его первая часть — авторы рассматривают уровень развития технологий обработки естественного языка, поиска и извлечения информации из текстов. 

Сейчас машинам всё еще трудно воспринимать естественную речь. Им недостаточно понимать смысл отдельных слов — необходимо построение языковых моделей и механизмов внимания, которые помогают ИИ определить вероятность следующего слова в предложении и улучшить качество ответов на запросы пользователей. Так, можно сделать вывод, что естественный разговор с роботом остаётся пока далёкой перспективой. Машинам необходимо более глубокое понимание различных логических связей, человеческой эмпатии и поведения собеседника. 

Системы распознавания и синтеза речи также развиваются довольно быстро. Из самых успешных примеров в альманахе выделены Siri от Apple, Cortana от Microsoft и Google Assistant. Экспертами рассматриваются процент ошибки машин в понимании речи и определены самые удобные инструменты для обучения искусственного интеллекта разговору. 

Исследователи выявили, что машинам на сегодняшний день удаётся почти без ошибок распознавать человеческую речь, но проблемы возникают в ситуациях, когда речь не подготовлена и не записана специально, а происходит в неформальной обстановке. Проблемы в синтезе речи включают в себя имитирование эмоциональности речи и синтез редких языков, которые обладают недостаточным объёмом данных для моделирования.

Далее исследователи измерили качество машинного перевода и генерации текстов. Одним из ключевых нововведений является использование доменно-адаптивного машинного перевода, который позволяет “дообучать” системы перевода на собственных данных и повысить качество перевода исходя из задач конкретного заказчика. В генерации текста стоит проблема обучения машин генерировать речь не слово за словом, а в соответствии с целостным планом диалога. 

альманах-искусственный-интеллект
Предиктивные модели — мощное средство машинного обучения языку. Подобная языковая модель (language model) должна уметь предсказывать возможное продолжение отрывка текста и уметь генерировать целостный, осмысленный текст (источник: Альманах «Искусственный интеллект»)

Предиктивные модели мощное средство машинного обучения языку. Подобная языковая модель (language model) должна уметь предсказывать возможное продолжение отрывка текста и уметь генерировать целостный, осмысленный текст.

Были также рассмотрены сервисы анализа тональности (определение отношения или реакции говорящего или пишущего субъекта к какому-либо объекту, действию или событию). На данный момент машины с большой точностью способны определить, каков характер высказывания — негативный или позитивный — и даже меру его субъективности. 

По прогнозам экспертов, в период с 2019 по 2024 гг. глобальные расходы на диалоговые сервисы будут увеличиваться на 34,75% ежегодно и достигнут своего значения $7,59 млрд к концу периода.

Так в Альманахе оценивается перспектива развития рынка диалоговых систем (чат-ботов). Особое внимание было уделено методам оценки качества виртуальных ассистентом. Чат-боты уже используются в различных секторах бизнеса, включая туристическую и финансовую индустрии, HR и недвижимость и становятся всё более распространённым инструментом коммуникации между бизнесом и клиентами. Перед разработчиками стоит важная задача сделать чат-ботов максимально эффективными, удобными и приятными для разговора.

Ведущие разработчики ИИ в России

Как уже было сказано выше, Наносемантика вошла в топ-15 компаний в России в области NLP по мнению авторов Альманаха. Была упомянута статистика наших проектов: за 2018 год наши чат-боты совокупно обработали более 15.327.000 млн запросов (в 2,5 раза больше по сравнению с 2016 годом). Также были упомянуты наши проекты для таких компаний, как «Сбербанк», Ford, BMW, Beeline, Headhunter, «Ростелеком» и отмечено то, что разработки ведутся полностью на наших собственных инструментах (языки разметки диалогов, диалоговый процессор, базы знаний и словари).

альманах-искусственный-интеллект
Карта российских компаний, которые работают в области NLP, распознавания и синтеза речи, и областей технологий, на которых они специализируются. В центре находятся компании, которые активны во всех перечисленных областях (источник: Альманах «Искусственный интеллект»)

В список также вошли Яндекс, ЦРТ, ABBYY, Just AI и другие ведущие разработчики систем ИИ. Среди выдающихся разработок компаний были выделены голосовой помощник Яндекс Алиса, инновационные технологии голосовой биометрии, обработки и анализа аудио- и видеоинформации группы ЦРТ, Just AI Conversational Platform — платформа для разработки разговорных чат-ботов, понимающих естественный язык.

В сборнике можно ознакомиться с интересными случаями применения ИИ-технологий и трендами развития отдельных отраслей — логистики и промышленности, финансов и страхования, медицины и юридической сферы. Из проведённого анализа видно, что системы искусственного интеллекта усиленно обучаются “вести себя” естественно и лучше понимать человека. Количество голосовых роботов будет расти, так же как и их повсеместное внедрение в устройства и системы – именно так можно сформулировать общую тенденцию развития технологии ИИ в обозримом будущем. 

Скачать Альманах можно на официальном сайте: http://aireport.ru/