Котики, собаки и машинное обучение: как прошёл вебинар «Наносемантики» для Российского движения школьников

Всего просмотров: 279

 

23 и 30 апреля мы провели вебинары для Российского движения школьников на тему: «Искусственный интеллект и машинное обучение». Спикерами выступили: Станислав Ашманов, генеральный директор «Наносемантики», Дмитрий Пантюхин, преподаватель МФТИ, старший преподаватель НИУ ВШЭ и Тимофей Москалец, продакт-менеджер «Наносемантики».

На вебинаре мы рассказали о том, в каких областях применяется искусственный интеллект и машинное обучение, кто такой Data scientist, и где учиться этой профессии. В рамках вебинара состоялась и презентация курса «Наносемантики» для учеников 10-11 классов.

 

Кто такой Data Scientist 

На вебинаре Станислав рассказал школьникам о профессии “Data Scientist”: чем он занимается, где можно этому научиться, какой уровень дохода у такого специалиста.

 

Цитата Станислава Ашманова:

«Data Scientist — это тот специалист, который знает, какие нейросети и как нужно обучать. Он хорошо знаком с языком программирования Python. И, как правило, таких специалистов всегда не хватает, они очень востребованы на рынке труда. Например, новичок без опыта работы вполне может зарабатывать около 100 тысяч рублей в месяц».

 

Области применения Искусственного интеллекта

В ходе вебинара слушатели могли задавать вопросы Станиславу в прямом эфире. Так, один из вопросов был о том, в каких еще областях может использоваться ИИ, но пока не используется.

В своём ответе Станислав отметил две отрасли:

—  медицина — а именно точная постановка диагнозов и обработка больших данных;

— промышленность — сфера, в которой даже самый малый вклад может дать большие результаты. Например, если ИИ сможет ещё на этапе производства фиксировать дефекты материалов и оборудования, это позволит избежать отгрузок некачественной и дорогостоящей продукции заказчикам.

 

Как работает ИИ и машинное обучение

Станислав Ашманов также рассказал школьникам о том, что такое Искусственный интеллект и машинное обучение, и в каких сферах применяются эти технологии.

 

Цитата Станислава Ашманова:

«Если говорить простыми словами, то искусственный интеллект — это автоматизация тех задач, которые раньше решались только человеком. Калькулятор заменил счетовода. Машинный перевод заменил переводчика. Чат-бот – сотрудника колл-центра и продавца. ИИ – это любая программа, которая заменяет человека в определённых ситуациях. Но не всегда это возможно и не всегда это правильно: например, нельзя заменять судью или врача – это те профессии, которые требуют чёткого представления о морали, добре и зле».

 

А что такое машинное обучение? Это набор алгоритмов и методов, который позволяет копировать действия человека и выполнять их с помощью специальных программ. 

В качестве примера Станислав привел простую ситуацию. Если у человека спросить, чем отличается кошка от собаки, то он вряд ли сможет сразу перечислить все параметры, по которым отличаются эти животные друг от друга. 

А если задать такой вопрос «обученной» машине, то ответ будет базироваться на исследовании большого количества закономерностей и параметров внешности данных животных, а также с использованием программы, которая поможет эти закономерности выявить. Это и есть машинное обучение — в работу подключается математический алгоритм и нейронные сети.

Нейронная сеть, в конечном итоге, — это просто умножения и сложения большого количества чисел. Именно она и даст ответ на вопрос: в чем отличие кошки от собаки.

Пример с кошкой и собакой — это лишь один из примеров работы нейронной сети, так называемая бинарная классификация. Кроме нее в арсенале нейронных сетей и множество других задач. На вход нейронной сети подается картинка с собакой или кошкой, а на выходе будет число 0 (например, кошка) или 1 (собака).

Для работы с искусственным интеллектом и машинным обучением обычно используется язык программирования Python. На нем пишут как код для загрузки и предобработки данных, так и код архитектуры, обучения, проверки и тестирования нейронных сетей. Обученную нейронную сеть можно подключить, например, к чат-боту или встроить в мобильное приложение.

 

Где учиться на Data Scientist 

Ещё один интересный вопрос из чата – где же учат такой современной профессии. Среди вузов, которые стоит рассмотреть, Станислав отметил МГУ, Сколковский институт науки и технологий, МФТИ, Высшую школу экономики, Московский государственный технический университет имени Н. Э. Баумана.

 

Анонс курса для 10-11 классов

В рамках вебинара также состоялась презентация бесплатного курса «Машинное обучение и нейросетевые технологии для школьников». Курс стартует в сентябре 2021 года, но интерактивные обучающие материалы доступны уже сейчас.

Цель курса — познакомить учеников 10-11 классов с языком программирования Python, с практическими основами современного машинного обучения и нейронных сетей на конкретных примерах и задачах. Курс разделен на две части: базовые методы машинного обучения (логистическая регрессия, метод деревьев и др.) и нейронные сети и решение задач с их помощью.

Курс построен по принципу «минимум теории, максимум практики». Работа строится в интерактивном сервисе Jupyter Notebook (Google Colab), который позволит сразу же увидеть результаты расчетов, совместить теоретические и практические материалы в web-интерфейсе.

 

Программа курса 10 класс:

  1. Работа с данными Python 
  2. Визуализация данных в Python
  3. Введение в машинное обучение, задачи классификации и регрессии
  4. Методы машинного обучения, ансамблирование
  5. Введение в нейронные сети

Программа курса 11 класс:

  1. Сверточные нейронные сети
  2. Рекуррентные нейронные сети
  3. Генеративно-состязательный подход
  4. Обработка изображений, текстов и звуков
  5. Методы вычислительного интеллекта

 

В рамках вебинара на примере одного из уроков сотрудник Наносемантики Дмитрий Пантюхин, преподаватель МФТИ, старший преподаватель НИУ ВШЭ рассмотрел темы:

—  «Векторные представления текста», где рассказал о том, как представлять текст в компьютере с помощью векторов, как проводить обработку таких векторов так, чтобы это имело смысл с точки зрения текста (Россия — Москва + Лондон = Великобритания)

— «Состязательные атаки на нейронные сети», где наглядно показал, что нейронные сети легко обмануть, изменив картинку так, что для человека она не поменяется, а нейронная сеть не сможет распознать ее правильно, и как бороться с таким обманом.

Также от учеников были заданы вопросы касательно профессии и перспектив после прохождения курса. Как отметил Дмитрий, после прохождения курса школьники смогут найти подработку или продолжить обучение по специальностям: Data scientist, Machine learning engineer, NLP-специалист, Data analyst. Новые знания и навыки позволят найти работу в качестве фрилансера, в стартапе или крупной компании, в том числе и в компании «Наносемантика».

После презентации курса учеников ждала практическая часть, в которой на конкретных примерах Тимофей Москалец, продакт-менеджер «Наносемантики», показал, как работают распознавание речи и синтез речи NLab Speech.

После чего ведущий и зрители задавали свои вопросы, а один из самых ярких вопросов звучал так: «Интересно ли быть программистом?»

Как отметил Тимофей, интерес присутствует на всех этапах работы программистом: начиная от зарождения идеи, во время самой разработки, но особенно — на этапе завершения проекта, внедрения и реализации, когда виден конечный результат. «Большую ценность добавляет и положительная обратная связь от пользователей, которые взаимодействуют с твоим продуктом или технологией. В такие моменты понимаешь: все было не зря, проделана большая работа, внесен весомый вклад в развитие отрасли и оставлен яркий цифровой след. Но при этом изначально у программиста должна быть любовь к профессии и делу, желание создавать что-то новое, исследовать и учиться», — подчеркнул Тимофей.

 

Вебинары «Наносемантики» про искусственный интеллект и машинное обучение доступны в записи в официальной группе «Российское движение школьников», на данный момент их посмотрели уже почти 400 тысяч человек.

https://vk.com/videos-122623791

https://vk.com/videos-122623791