
2022 год в числах
- завершили 40 проектов по искусственному интеллекту
- разметили 130 тыс. изображений
- записали короткие записи голосов 1500 дикторов
- отдел лингвистики выполнил 724 задачи, из них 141 «срочную»
Мы научились проверять школьные сочинения
Мы создали систему искусственного интеллекта для проверки сочинений ЕГЭ на английском и получили приз технологического конкурса Up Great ПРО//ЧТЕНИЕ.
Экзаменационные сочинения проверяют «вручную», причём на каждое из них уходит 10-15 мин. Создать систему искусственного интеллекта, которая справлялась бы с проверкой сочинений на русском и английском на уровне эксперта – таково было задание для участников конкурса Up Great ПРО//ЧТЕНИЕ.
В 2022 году двум командам, наконец, удалось пройти технологический барьер в анализе англоязычного текста. Искусственный интеллект, созданный командой «Наносемантики», справился с анализом текста на 5,49% эффективнее эксперта и в 120 раз быстрее. А команда получила приз 20 млн руб.
Мы продолжаем работу над сервисом для школьников и учителей: призовые потратим на развитие лингвистических технологий, в первую очередь, на системы искусственного интеллекта для проверки грамматики и стилистики русскоязычных и англоязычных текстов.
Технологии синтеза и распознавания речи NLab Speech теперь в Едином реестре
Две собственные технологии «Наносемантики» на русском языке – технология синтеза речи NLab Speech TTS и распознавания речи NLab Speech ASR – в 2022 году вошли в Единый реестр российских программ для электронных вычислительных машин и баз данных. В него включены отечественные информационные системы, соответствующие требованиям Минцифры.
Обе технологии основаны на методах компьютерной лингвистики и нейросетях. NLab Speech TTS формирует речевой сигнал по печатному тексту, а NLab Speech ASR, наоборот, с высокой точностью распознает голосовой сигнал и преобразует в текст.
Диалоговая платформа для виртуальных ассистентов NLab (Dialog OS) уже есть в Реестре. А включение еще двух продуктов открывает для нас широкие возможности по работе с российскими заказчиками, в том числе с госсектором.
ВТБ внедрил в защищенный контур платформу разметки данных «Маркер»
ПАО «ВТБ» требовалось размечать аудиофайлы для кол-центра и текстовые данные для машинного обучения. Для этих задач банк выбирал универсальную промышленную платформу, которая позволила бы штатным специалистам самостоятельно размечать данные разных типов и администрировать этот процесс. Выбор пал на платформу разметки данных «Маркер», которая сочетает в себе функциональность, удобство и гибкость.
Теперь наша платформа помогает специалистам ВТБ быстрее подготавливать обучающие данные и лучше контролировать их качество. Работа «Маркера» в защищенном контуре гарантирует безопасность личной информации клиентов банка. В следующем году в рамках сотрудничества с ВТБ мы будем развивать возможности «Маркера»: добавим новый функционал по разметке видео и изображений.
Аля консультирует покупателей «Лэтуаль» в онлайн-пространстве
Специально для интернет-магазина, мобильного приложения и мессенджеров «Лэтуаль» мы создали виртуальную бьюти-помощницу. Аля работает круглосуточно – и всегда в отличном настроении. Она помогает магазину разгрузить колл-центр, а покупателям – в любое удобное время выбрать товар или получить консультацию.
Мы направили силу искусственного интеллекта Али на решение нетиповых задач. Помощница не только отвечает на множество вопросов. Она еще и помогает проверить баланс карты лояльности по номеру, а при необходимости переключает диалог на оператора или формирует запрос в группу поддержки.
Аля уже приняла более 100 тыс. сообщений и провела 20,5 тыс. диалогов. Доля распознанных вопросов превысила 92%.
Мы стали партнерами «Тотального диктанта»
«Тотальный диктант» – это добровольный диктант для всех, кто хочет проверить свою грамотность. Он проходит каждый год на очных площадках и в онлайн-формате. В 2022 году в диктанте участвовали более 780 тыс. человек по всему миру, а отличниками стали 7% участников.
Мы много лет поддерживаем эту акцию, как и другие инициативы, связанные с развитием русского языка и грамотности. Например, автоматическая система проверки для «Тотального диктанта» – наш проект. А в уходящем году отличники получили от нас в подарок ключи для установки «Орфо» – умной системы для проверки правописания.
Почти все наши клиенты перешли на платформу Dialog OS
Теперь каждый из них может самостоятельно создавать и обучать чат-ботов, используя шаблоны или собственные варианты ответов. Виртуальные помощники, созданные на Dialog OS, распознают запросы пользователей на естественном языке, а затем быстро и точно генерируют ответ с учетом контекста диалога. Нейросети и алгоритмы нечёткого поиска помогают друг другу извлекать информацию из сообщений аудитории наших голосовых помощников.
В наступающем 2023 году аналитики ожидают роста инвестиций в технологии искусственного интеллекта. Коллектив «Наносемантики» продолжит разработки в области искусственного интеллекта, чтобы вывести свои платформы и сервисы на новый уровень.
Всех с наступающими праздниками. Успехов в новом году!