

23 и 30 апреля мы провели вебинары для Российского движения школьников на тему: «Искусственный интеллект и машинное обучение». Спикерами выступили: Станислав Ашманов, генеральный директор «Наносемантики», Дмитрий Пантюхин, преподаватель МФТИ, старший преподаватель НИУ ВШЭ и Тимофей Москалец, продакт-менеджер «Наносемантики».
На вебинаре мы рассказали о том, в каких областях применяется искусственный интеллект и машинное обучение, кто такой Data scientist, и где учиться этой профессии. В рамках вебинара состоялась и презентация курса «Наносемантики» для учеников 10-11 классов.
Кто такой Data Scientist
На вебинаре Станислав рассказал школьникам о профессии “Data Scientist”: чем он занимается, где можно этому научиться, какой уровень дохода у такого специалиста.
Цитата Станислава Ашманова:
«Data Scientist — это тот специалист, который знает, какие нейросети и как нужно обучать. Он хорошо знаком с языком программирования Python. И, как правило, таких специалистов всегда не хватает, они очень востребованы на рынке труда. Например, новичок без опыта работы вполне может зарабатывать около 100 тысяч рублей в месяц».
Области применения Искусственного интеллекта
В ходе вебинара слушатели могли задавать вопросы Станиславу в прямом эфире. Так, один из вопросов был о том, в каких еще областях может использоваться ИИ, но пока не используется.
В своём ответе Станислав отметил две отрасли:
- медицина — а именно точная постановка диагнозов и обработка больших данных;
- промышленность — сфера, в которой даже самый малый вклад может дать большие результаты. Например, если ИИ сможет ещё на этапе производства фиксировать дефекты материалов и оборудования, это позволит избежать отгрузок некачественной и дорогостоящей продукции заказчикам.
Как работает ИИ и машинное обучение
Станислав Ашманов также рассказал школьникам о том, что такое Искусственный интеллект и машинное обучение, и в каких сферах применяются эти технологии.
Цитата Станислава Ашманова:
«Если говорить простыми словами, то искусственный интеллект — это автоматизация тех задач, которые раньше решались только человеком. Калькулятор заменил счетовода. Машинный перевод заменил переводчика. Чат-бот – сотрудника колл-центра и продавца. ИИ – это любая программа, которая заменяет человека в определённых ситуациях. Но не всегда это возможно и не всегда это правильно: например, нельзя заменять судью или врача – это те профессии, которые требуют чёткого представления о морали, добре и зле».
А что такое машинное обучение? Это набор алгоритмов и методов, который позволяет копировать действия человека и выполнять их с помощью специальных программ.
В качестве примера Станислав привел простую ситуацию. Если у человека спросить, чем отличается кошка от собаки, то он вряд ли сможет сразу перечислить все параметры, по которым отличаются эти животные друг от друга.
А если задать такой вопрос «обученной» машине, то ответ будет базироваться на исследовании большого количества закономерностей и параметров внешности данных животных, а также с использованием программы, которая поможет эти закономерности выявить. Это и есть машинное обучение — в работу подключается математический алгоритм и нейронные сети.
Нейронная сеть, в конечном итоге, — это просто умножения и сложения большого количества чисел. Именно она и даст ответ на вопрос: в чем отличие кошки от собаки.
Пример с кошкой и собакой — это лишь один из примеров работы нейронной сети, так называемая бинарная классификация. Кроме нее в арсенале нейронных сетей и множество других задач. На вход нейронной сети подается картинка с собакой или кошкой, а на выходе будет число 0 (например, кошка) или 1 (собака).
Для работы с искусственным интеллектом и машинным обучением обычно используется язык программирования Python. На нем пишут как код для загрузки и предобработки данных, так и код архитектуры, обучения, проверки и тестирования нейронных сетей. Обученную нейронную сеть можно подключить, например, к чат-боту или встроить в мобильное приложение.
Где учиться на Data Scientist
Ещё один интересный вопрос из чата – где же учат такой современной профессии. Среди вузов, которые стоит рассмотреть, Станислав отметил МГУ, Сколковский институт науки и технологий, МФТИ, Высшую школу экономики, Московский государственный технический университет имени Н. Э. Баумана.
Анонс курса для 10-11 классов
В рамках вебинара также состоялась презентация бесплатного курса «Машинное обучение и нейросетевые технологии для школьников». Курс стартует в сентябре 2021 года, но интерактивные обучающие материалы доступны уже сейчас.
Цель курса — познакомить учеников 10-11 классов с языком программирования Python, с практическими основами современного машинного обучения и нейронных сетей на конкретных примерах и задачах. Курс разделен на две части: базовые методы машинного обучения (логистическая регрессия, метод деревьев и др.) и нейронные сети и решение задач с их помощью.
Курс построен по принципу «минимум теории, максимум практики». Работа строится в интерактивном сервисе Jupyter Notebook (Google Colab), который позволит сразу же увидеть результаты расчетов, совместить теоретические и практические материалы в web-интерфейсе.
Программа курса 10 класс:
- Работа с данными Python
- Визуализация данных в Python
- Введение в машинное обучение, задачи классификации и регрессии
- Методы машинного обучения, ансамблирование
- Введение в нейронные сети
Программа курса 11 класс:
- Сверточные нейронные сети
- Рекуррентные нейронные сети
- Генеративно-состязательный подход
- Обработка изображений, текстов и звуков
- Методы вычислительного интеллекта
В рамках вебинара на примере одного из уроков сотрудник Наносемантики Дмитрий Пантюхин, преподаватель МФТИ, старший преподаватель НИУ ВШЭ рассмотрел темы:
- «Векторные представления текста», где рассказал о том, как представлять текст в компьютере с помощью векторов, как проводить обработку таких векторов так, чтобы это имело смысл с точки зрения текста (Россия - Москва + Лондон = Великобритания)
- «Состязательные атаки на нейронные сети», где наглядно показал, что нейронные сети легко обмануть, изменив картинку так, что для человека она не поменяется, а нейронная сеть не сможет распознать ее правильно, и как бороться с таким обманом.
Также от учеников были заданы вопросы касательно профессии и перспектив после прохождения курса. Как отметил Дмитрий, после прохождения курса школьники смогут найти подработку или продолжить обучение по специальностям: Data scientist, Machine learning engineer, NLP-специалист, Data analyst. Новые знания и навыки позволят найти работу в качестве фрилансера, в стартапе или крупной компании, в том числе и в компании «Наносемантика».
После презентации курса учеников ждала практическая часть, в которой на конкретных примерах Тимофей Москалец, продакт-менеджер «Наносемантики», показал, как работают распознавание речи и синтез речи NLab Speech.
После чего ведущий и зрители задавали свои вопросы, а один из самых ярких вопросов звучал так: «Интересно ли быть программистом?»
Как отметил Тимофей, интерес присутствует на всех этапах работы программистом: начиная от зарождения идеи, во время самой разработки, но особенно — на этапе завершения проекта, внедрения и реализации, когда виден конечный результат. «Большую ценность добавляет и положительная обратная связь от пользователей, которые взаимодействуют с твоим продуктом или технологией. В такие моменты понимаешь: все было не зря, проделана большая работа, внесен весомый вклад в развитие отрасли и оставлен яркий цифровой след. Но при этом изначально у программиста должна быть любовь к профессии и делу, желание создавать что-то новое, исследовать и учиться», — подчеркнул Тимофей.
Вебинары «Наносемантики» про искусственный интеллект и машинное обучение доступны в записи в официальной группе «Российское движение школьников», на данный момент их посмотрели уже почти 400 тысяч человек.