Основной целью соревнования было создание алгоритма, который поможет выявлять причины появления неправильного ответа на задачи по математике в автоматическом режиме.
Установить взаимосвязь между ошибками учеников и темами, которые нужно пройти, чтобы не совершать их, можно либо проанализировав огромное количество уже решенных задач, либо придумав задачи и список возможных ответов, включающий специально подобранные «дистракторы», то есть ответы, которые можно посчитать правильными только в случае, если у человека есть какой-то пробел в знаниях. Сейчас такое сопоставление делается вручную и занимает очень много времени. Кроме того, люди могут обозначать такие взаимосвязи по-разному, и по мере появления новых вопросов могут возникать дополнительные неточности.
Решение российской команды было построено на основе данных, состоявших из 4370 примеров задач и ошибок учащихся, полученных от организаторов соревнования, а также 13921 синтетическом примере, сгенерированном командой. Данные были использованы для дообучения открытой языковой модели Qwen, чтобы анализировать пару «вопрос и неправильный ответ», получая на выходе наиболее вероятное математическое заблуждение.
Соревнование, в котором приняло участие свыше 1,4 тыс. команд ученых и специалистов в области ИИ из 80 стран, было проведено EdTech-компанией Eedi, Университетом Вандербильта и лабораторией Learning Agency Lab. Его целью стало привлечение внимания научного сообщества к существующей проблеме и создание открытого списка решений, который поможет разработчикам и ИИ-тренерам со всего мира размечать данные, необходимые для развития систем ИИ в образовании.
Как надеются ученые, созданные ими подходы уже в ближайшем будущем найдут применение в работе онлайн-платформ для обучения школьников и студентов.
Компания «Вейн СиВи» (Vein CV) является разработчиком программно-аппаратных систем машинного зрения нового поколения для медицины и промышленности. Входит в группу компаний «Наносемантика».