
«Наносемантика» специализируется на разработке нейронных сетей и ИИ-технологиях и в данном проекте выступила технологическим партнером партии.
Разработчики «Наносемантики» забрали из библиотеки ЛДПР терабайты видеозаписей с выступлениями и архивную съемку знаменитого политика. Они извлекли из них аудио, выделили фрагменты с речью Владимира Жириновского при помощи внутреннего сервиса верификации диктора, а затем использовали полученные транскрипты в качестве обучающего датасета для LLM на базе GPT. Большая языковая модель (Large Language Model, LLM), которую предварительно обучили на большом количестве текстов на русском языке, — это главный компонент нейросети «Жириновский».
Объем датасета для обучения на данном этапе — порядка 50 тыс. инструкций, вопросов и ответов. Для создания голоса нейросети разработчики собрали и расшифровали более 3000 аудиороликов, причем каждый из них промаркировали и обозначили конкретный тип эмоции политика. Количество параметров обученной нейросети для синтеза речи — 48 млн; в процессе ее создания применили инновационные разработки, которые позволили сымитировать не только слова, но также интонацию и эмоции основателя ЛДПР. Объём параметров для LLM — порядка 1 млрд.
Для того чтобы анимировать виртуальный образ Жириновского, необходимо было управлять анимацией (движениями), эмоциями и лип-синком (синхронизацией голоса с движениями губ). По визуальной части также была проделана большая работа: опробованы десятки вариантов и вариаций и проведен опрос среди фокус-групп, чтобы узнать, какой образ находит наибольший отклик у людей.
«Идея создания цифровой версии Владимира Вольфовича вызвала большой исследовательский интерес у команды «Наносемантики», поскольку работа над уникальным проектом связана непосредственно с машинным обучением и большими данными. Владимир Жириновский как политик интересен именно своим огромным наследием, которое он оставил после себя в виде самых разнообразных аудио- и видеоматериалов, публикаций, книг, выступлений. У нас собрано более 100 часов речи, на которых можно качественно обучить нейросеть, а представленный сегодня вариант обучен на 10 часах. Это только начало», — обратился к собравшимся Станислав Ашманов, генеральный директор «Наносемантики», во время демонстрации алгоритма на ПМЭФ-2023.
«Для искусственного интеллекта, алгоритма, на первом этапе мы считаем результат более чем продвинутым. Это первый в мире политический алгоритм. Это смелый проект. Это проект, который только начинается», — прокомментировал председатель ЛДПР Леонид Слуцкий показ нейросети «Жириновский» на ПМЭФ-2023
Посмотреть демонстрацию нейросети «Жириновский» на ПМЭФ-2023 можно по ссылке.