Тренды развития ИИ в России
Как искусственный интеллект обретает лицо и теряет свободу.

Статья написана специально для крупнейшего бизнес-издания «Коммерсантъ».

Искусственный интеллект — самая обсуждаемая технология 2023 года. Взрыв интереса к нему вызван впечатляющими достижениями в области генеративных нейросетей, которые Gartner поместила на вершину своей «кривой хайпа». О том, обоснован ли ажиотаж вокруг ИИ и какие тенденции определят его развитие в 2024 году, рассуждает Станислав Ашманов, генеральный директор компании «Наносемантика», заведующий лабораторией нейросетевых технологий и компьютерной лингвистики МФТИ.

Объем инвестиций в технологии искусственного интеллекта в глобальном масштабе в ближайшие три года вырастет в два раза, прогнозирует IDC: с $154 млрд в 2023 году до $300 млрд в 2026-м. Пока наиболее популярными сценариями использования ИИ в мире являются чат-боты для поддержки клиентов, системы аналитики продаж и рекомендательные сервисы — на такие решения приходится четверть расходов в этом году. Больше всего тратят на ИИ банки и ритейл.

При этом расходы компаний на решения на основе генеративного ИИ (GenAI) в ближайшие пять лет будут расти в среднем на 73,3% в год — это в два раза быстрее, чем расходы на ИИ в целом, и в 13 раз быстрее общих инвестиций в IT.

Если судить не по бюджетам, а по новостям СМИ, в прошлом году больше всего их было именно про генеративный ИИ, в частности, про ChatGPT — чат-бот, который запустил тренд на использование ИИ в совершенно различных областях.

Генеративный ИИ

В 2023 году ИИ научился работать одновременно с различными типами данных, повысились точность и качество генерируемой информации. ИИ-помощники были встроены во множество приложений — от поисковых систем до редакторов изображений и даже программного кода. Более того, появилась новая сфера деятельности людей — промпт-инжиниринг — формирование правильных запросов к нейросети, чтобы она сгенерировала релевантный и достоверный ответ.

Сегодня голосовое управление с ИИ появляется все в большем числе гаджетов, программ и иных систем. Люди стали относиться к таким помощникам как к чему-то само собой разумеющемуся. Но одновременно доверие к ним снизилось из-за наплыва созданных ИИ фейковых данных, которые выглядят как достоверные.

От экспериментов — к серьезным проектам

В России картина несколько иная. В целом, по информации правительства РФ, 52% крупных организаций в России используют искусственный интеллект в своей деятельности и около 21% планируют начать это делать в ближайшее время. Однако речь идет преимущественно об экспериментах. В сентябре 2023 года Институт статистических исследований и экономики знаний НИУ ВШЭ опубликовал результаты мониторинга распространения искусственного интеллекта в стране. Из 2,4 тыс. опрошенных компаний 65% используют ИИ лишь в тестовом режиме, примеряя технологию к своим бизнес-задачам.

По нашему мнению, данным различных исследований и опросу наших клиентов, в российском бизнесе наиболее востребовано компьютерное зрение (его используют 78,7% компаний), а также распознавание и синтез речи (62%). Рекомендательные системы на основе предиктивной аналитики и больших данных интересуют 40,7% опрошенных.

Лидерами в освоении технологии, по данным индекса ИИ, названы компании из финансовой сферы и информационно-коммуникационных технологий. Например (это уже данные опроса ассоциации «Финтех»), 95% компаний финансового рынка внедрили ИИ в основные процессы. Торговля — среди отстающих, в группе отраслей на начальной стадии внедрения.

Расходы на ИИ в России в мировом масштабе — капля в море, 0,2% (650 млрд руб. против $432 млрд). Однако потенциал для развития технологии и ее применения колоссальный. Поэтому идею драйвят на самом высшем уровне. В этом году президент России поручил обновить и продлить до 2030 года Национальную стратегию развития искусственного интеллекта, а также поставил задачу интегрировать ИИ во все отрасли экономики и в социальную сферу. Об этом несколько раз говорил и премьер-министр на правительственных мероприятиях и встречах с бизнесом.

Сейчас в России стартовал переход от начальной стадии освоения технологии к развивающейся. И это будет очень интересное время. Какие тренды определят развитии ИИ в 2024 году?

KMO_120929_05986_1_t241_100041.webp

№1. Улучшение систем генеративного ИИ — мультимодальность

За последние три года точность языковых моделей существенно увеличилась, одновременно возросла и стоимость их разработки. Так, в отчете Стэнфордского университета подсчитано, что первая большая языковая модель (LLM) GPT 2, выпущенная в 2019 году, имела 1,5 млрд параметров, и ее обучение стоило около $50 тыс. А модель PaLM от компании Google (2022 год) имела 540 млрд параметров и стоила $8 млн. То есть PaLM примерно в 360 раз больше, чем GPT 2, и в 160 раз дороже. Появилось и множество открытых LLM-моделей, как минимум можно упомянуть LlaMA 2, Saiga и Mistral.

В 2024 году будет развиваться виральность мультимодальных сетей, соединяющих изображения и тексты, генерирующих ответ по изображению (помимо GPT 4, яркий пример открытой модели — LLaVA 1.5). Развитие мультимодальных сетей связано также с распознаванием и синтезом речи, внедрением сетей в умные устройства и роботы для взаимодействия не только с голосом, но и с изображением с камеры.

2024 год будет ознаменован развитием первых моделей text-to-video, позволяющих генерировать видео по текстовому запросу (как пример, вышедшая недавно нейросеть Sora от OpenAI). Уже начался настоящий прорыв моделей, генерирующих музыку и, в частности, подменяющих голос исполнителя. На YouTube можно найти огромное количество AI-каверов, в том числе от уже давно покинувших нас вокалистов.

Россия — одна из немногих стран, у которой есть собственные наработки в этой сфере. Например, наиболее известные нейросети — GigaChat и Kandinsky от «Сбера», YaLM от «Яндекса». Появляются и другие разработки.

№2. Привычные программы обретут новые функции

Продолжает набирать скорость автоматизация. Любая рутинная деятельность постепенно переходит к машинам — ее будут выполнять станки, IT-системы, роботы. Уже сейчас генеративный ИИ встраивается в привычные программы — текстовые и визуальные редакторы, социальные сети, мессенджеры, средства проектирования — и добавляет им продвинутые возможности.

Например, архитектору не придется каждый раз проектировать здание и его инженерную инфраструктуру с нуля — это сделает нейросеть, обученная на большой базе уже выполненных проектов. Так и на любом производстве — ИИ способен проектировать детали и конструкции с наилучшими характеристиками: прочнее, легче, эффективнее в работе. А системы анализа и генерации кода в средах разработки сильно упростят работу программиста.

№3. Начало трансформации системы образования

50% студентов уже используют нейросети в учебных целях, показало исследование Skillfactory. Большинство из них (83%) с помощью ИИ пишут и редактируют тексты. Кроме этого, нейросети помогают писать программный код, переводить тексты с иностранного языка, создавать иллюстрации — то есть берут на себя все те же рутинные операции.

Кроме этого, в России уже есть примеры внедрения нейросетей со стороны самого учебного заведения. Например, они используют алгоритмы ИИ для создания индивидуальных программ обучения, повышения эффективности обучения и для оценки успеваемости студентов. В перспективе возможно создание цифровых аватаров исторических деятелей для участия в процессе обучения или работе музеев.

№4. ИИ становится более подотчетным

В мире нарастает тренд на регулирование ИИ. Законодательные акты, касающиеся ИИ, уже выпустили 127 стран. Например, в этом году Европейский парламент разработал проект закона об ИИ. Он ограничит использование распознавания лиц, потребует от создателей систем ИИ раскрывать больше информации о происхождении данных, на которых обучалась нейросеть. Кроме этого, инициатива предлагает запретить ИИ сбор биометрических данных из соцсетей, а также использование технологии определения эмоций правоохранительными органами, пограничными службами, на рабочих местах и в учебных заведениях. Окончательный вариант закона должен быть принят в первой половине нынешнего года.

Регулировать ИИ будет и бизнес. По мнению Gartner, управление доверием, рисками и безопасностью ИИ (AI Trust, Risk and Security Management, AI TRiSM) — это один из основных стратегических технологических трендов 2024 года. Под AI TRiSM понимают комплексную программу для упреждающего выявления и снижения рисков.

В России пока нет законодательства об ИИ, но в 2024 году государство и бизнес уже активно обсуждают регулирование этой сферы. Первой попыткой как-то очертить границы использования ИИ стал Кодекс этики в сфере искусственного интеллекта. Его поддержали около 270 организаций. Главным приоритетом при развитии технологий, сказано в документе, является защита интересов и прав людей и каждого отдельного человека.

№5. ИИ как технология улучшения клиентского сервиса

Последние два-три года компании уделяют много внимания опыту клиента (Customer experience, CX). ИИ значительно поднимет уровень взаимодействия с пользователями и покупателями, позволив перейти к настоящей гиперперсонализации. Сценарии применения нейросетей для построения опыта клиента безграничны: более глубокое понимание потребностей клиентов за счет анализа поведения, выстраивание систем лояльности, создание динамических маркетинговых кампаний, оптимизация обслуживания клиентов и т. д.

Чат-боты на основе генеративных нейросетей и более совершенных языковых моделей способны улучшить опыт клиентов, которых раздражают более простые версии виртуальных помощников. Обновленные чат-боты смогут отвечать на вопросы точнее и быстрее, строго в соответствии с требованиями клиентов.

№6. Нейросети обретают облик — цифровые аватары

Цифровой аватар — это виртуальный персонаж, наделенный искусственным интеллектом. Он поддерживает беседу на разных языках, понимает голосовые команды и может выполнять поручения. Та же Алиса, только визуализированная на любом экране — от смартфона до билборда. Более того, цифровых аватаров можно научить демонстрировать эмоции и узнавать людей, с которыми они общаются. И все это благодаря видеоаналитике, нейросетям, технологиям распознавания голоса и синтеза речи. Можно обучить нейросеть говорить на любом языке — и это перспективно для бизнеса, работающего с людьми из разных стран, в международных проектах.

Цифровые аватары начнут появляться на ресепшенах отелей, на выставочных стендах и деловых мероприятиях, на кассах магазинов и за стойкой администратора в медицинских центрах.

Так, цифровой аватар «Снежинка» создан компанией «Наносемантика» для Международной арктической станции по инициативе Московского физико-технического института. «Снежинка» владеет полной информацией о станции и ее проектах, точно определяет статус и возраст посетителей по лицу и одежде, понимает вопросы и адаптирует ответ под того, с кем общается.

№7. Роботы с применением искусственного интеллекта

Развитие искусственного интеллекта, в том числе компьютерного зрения и больших языковых моделей, дошло до уровня, когда стало возможным выпускать в жизнь роботов. Работает это так: от компьютерного зрения данные поступают в большую языковую модель, она сопоставляет их со своей задачей и принимает решения о дальнейших действиях. Таким образом, LLM выступают анализаторами окружающей робота обстановки.

Например, мы в «Наносемантике» сейчас приземляем распознавание речи, синтез и движок голосового помощника на борт робота-собаки. Таких роботов уже можно использовать в промышленности. Генеративный ИИ понимает запросы человека, сформулированные в любой форме — намного лучше, чем обычные голосовые помощники.

Только вперед!

С одной стороны, искусственный интеллект демократизируется — бизнес может использовать готовые модели, приспосабливая их под свои задачи. И сейчас мы наблюдаем настоящий бум внедрения функций на основе ИИ в различные сервисы. Это делает жизнь людей проще и удобнее.

С другой стороны, развитие технологии, ее проникновение во все сферы жизни ставят перед государством и бизнесом серьезные вызовы: кто будет разрабатывать и развивать ИИ, как извлечь максимальную ценность из него и избежать множества рисков, нужно ли вступать в гонку по созданию генеративных нейросетей и пытаться догнать мировых лидеров — и где взять на это ресурсы? Ответы на эти и многие другие вопросы, связанные с искусственным интеллектом, мы будем искать в ближайшие годы.

Похожие статьи