Прямой эфир
Ошибка воспроизведения видео. Пожалуйста, обновите ваш браузер.
Лента новостей
Чем заменить TeamViewer: десять аналогов Индустрия 4.0, 02 дек, 17:01
Мир без границ: как удаленная работа меняет географию и формы занятости Социальная экономика, 02 дек, 14:44
РБК проведет второй ежегодный форум о развитии инфраструктурных проектов Новая экономика, 02 дек, 11:40
Новая экономика. Перспективы беспилотных летательных аппаратов Новая экономика, 02 дек, 11:10
Вектор развития бизнеса в России. Главное с форума РБК «Новая экономика» Бизнес, 01 дек, 21:09
Эксперты оценили перспективы особых экономических зон как драйверов роста Бизнес, 01 дек, 19:12
С 1 декабря выросли тарифы за ЖКУ: как изменятся платежи Недвижимость, 01 дек, 18:43
На форуме «Новая экономика» обсудили роль программы импортозамещения Инициатива, 01 дек, 15:04
Замглавы Минфина оценил роль рынка облигаций в развитии экономики страны Инициатива, 01 дек, 13:50
Инвестиции в территории Амурской области опередили показатели 2021 года Инициатива, 01 дек, 13:18
В Совфеде выделили три приоритетные сферы господдержки в новых условиях Инициатива, 01 дек, 12:37
На форуме «Новая экономика» предложили смену подходов к импортозамещению Инициатива, 01 дек, 11:54
ЦБ зафиксировал снижение объемов выдачи ипотеки Недвижимость, 01 дек, 10:23
Кого травят на работе: изучаем буллинг в корпоративной среде Бизнес, 30 ноя, 15:17
AI Journey 2022 ,  
0 

Сбер показал нейросеть Kandinsky 2.0 для генерации изображений по текстам

На международной конференции «Путешествие в мир искусственного интеллекта» AI Journey Сбер представил первую российскую диффузионную модель для создания изображений из текстов на разных языках.

Нейросеть называется Kandinsky 2.0 и отличается от своей первой версии не только мультиязычностью, но и использованием диффузионного подхода. В отличие от общепринятого метода трансформеров, она дает более сочную, глубокую и реалистичную картинку, показывая лучшие результаты при конвертации текстовых описаний в мультимедийный контент, отмечается в сообщении пресс-службы банка.

Разработчики из Sber AI проектировали и обучали «Кандинского» 2.0 при поддержке ученых Института искусственного интеллекта AIRI, работая на объединенном датасете Sber AI и SberDevices. Эта база содержит 1 миллиард пар «текст-изображение», благодаря чему нейросеть способна генерировать изображение по двум миллиардам параметров текстовых данных. Модель работает с запросами на 101 языке, причем понимает тексты одновременно на нескольких из них. В списке опций — от распространенных английского и русского до редких языков вроде монгольского. Умная нейросеть оперирует не буквальным «подстрочным» переводом, а понимает культурный и смысловой контекст. Например, при запросе «национальное блюдо» на русском языке Kandinsky 2.0 нарисует скорее всего щи, а для японского языка — суши или мисо суп.

Расширены и визуальные опции Kandinsky 2.0 в сравнении с предшествующей моделью. Нейросеть научили обрабатывать изображения в 20 различных стилях, от классицизма и мультипликации до хохломы и новогоднего. Реализованы функции inpainting и outpainting: в первом случае нейросеть генерирует собственные фрагменты вместо объектов пользователя, а во втором — дорисовывает готовое изображение и фон вокруг картинки.

Разработчики называют вторую версию «Кандинского» прорывом в сфере искусственного интеллекта и машинного обучения, а также приближением к созданию AGI (Artificial General Intelligence) — сильного искусственного интеллекта. Так называемый креативный искусственный интеллект актуален для бизнеса, поскольку позволяет генерировать за несколько секунд уникальную картинку под конкретные задачи, приближать ее к реалистичным изображениям, создаваемым людьми, распространять и использовать ее без лицензии.

Первый заместитель председателя правления Сбербанка Александр Ведяхин на презентации Kandinsky 2.0 сообщил, что она доступна на сайте FusionBrain, а также при помощи команды «Запусти художника» на умных устройствах Сбера и в мобильном приложении «Салют». FusionBrain это открытый портал для демонстрации моделей AGI, и Сбербанк поддерживает этот проект — в том числе, первым выложив на этом ресурсе свою нейросеть.

В ответ на запрос «РБК рассказывает бизнесу о новой экономике» нейросеть вывела андроида на фоне офисов Москва-сити.