С помощью гранта Российского фонда развития информационных технологий (РФРИТ) «Наносемантика» разработала нейросети для предобработки аудио и разметки изображений. Кроме того, благодаря гранту разработчики смогли перенести разметку данных в единый инструмент. А еще на платформе создали рейтинговую систему для разметчиков на основе выполненных ханипотов (тестовых заданий). Подобная система дает возможность отслеживать качество работы разметчиков и видеть необходимость в проведении дополнительного обучения.
Новая функция предобработки аудио позволяет разметчикам удалять тишину, нарезать аудиозапись и переводить ее в текст с разных языков, а специальные нейросети для разметки изображений (инструменты Magic Wand и One-Shot) позволяют мгновенно находить нужные объекты на картинках.
Размеченные данные (датасеты) необходимы разработчикам для обучения искусственного интеллекта. На них, в частности, обучают систему автоматического распознавания речи (например, умные станции типа «Алисы») и компьютерное зрение, например, определение скорости автомобиля по видеозаписи с камер безопасности дорожного движения.
На данный момент приближается завершающий этап проекта «Доработка платформы сбора и разметки данных «Маркер»». В рамках гранта, который длился почти 2 года, разработчики «Наносемантики» добавили целый ряд полезных инструментов, которые ускоряют и облегчают «ручной» труд разметчиков.