Сбер создал первую мультимодальную нейросеть ruDALL-E

Сбер создал первую в мире нейронную сеть ruDALL-E, которая способна создавать изображения на основе текстового описания на русском языке. Использовать ее можно для создания вариантов дизайна интерьера, стоковых изображений или векторных иллюстраций, материалов для рекламы, копирайтинга, архитектурного и промышленного дизайна. Попробовать ruDALL-E можно уже на его сайте

Нейросеть одновременно обучается на двух видах данных — картинках и текстах, и позволяет создавать неограниченное число новых изображений по заданному описанию. Есть два варианта модели:

  • ruDALL-E XL, содержащая 1,3 миллиарда параметров;
  • ruDALL-E 12B с 12 миллиардами параметров.

Моделью ruDALL-E XL можно воспользоваться бесплатно, загрузив её с сервиса Github. Обе модели также вскоре будут доступны на платформе ML Space в хабе предобученных моделей и датасетов DataHub от SberCloud.

Создание изображений при помощи ruDALL-E происходит в три этапа: сначала одна нейросеть принимает текст на вход и генерирует заданное число картинок, затем следующая выбирает, какие из них наиболее удачны и максимально соответствуют описанию, а третья увеличивает их в размере без потери качества. Таким образом можно получить неограниченное количество новых изображений, подходящих под указанные характеристики.

Архитектура модели DALL-E для английского языка была впервые представлена OpenAI в 2021 году, однако эта модель так и не была полностью выложена в открытый доступ. На основе публикации OpenAI команды SberDevices и Sber AI при содействии SberCloud воспроизвели код и запустили обучение нейросети на платформе ML Space на базе суперкомпьютера Кристофари, получив аналогичный результат для русского языка. В результате получилась самая большая модель такого рода в мире, работающая с русским языком: обучение заняло 23 тысячи GPU-часов на массиве данных из 120 миллионов пар текст-изображение. Проект по обучению ruDALL-E стал самым большим нейросетевым вычислительным проектом в России и СНГ.

SberDevices — компания экосистемы Сбер, центр экспертизы по решениям на основе искусственного интеллекта в таких областях, как речевые технологии, технологии понимания естественного языка, лицевая и голосовая биометрия. Компания также фокусируется на создании умных устройств для конечных потребителей и корпоративных клиентов. SberDevices учреждена в мае 2019 года в качестве департамента блока «Технологии» Сбербанка.

Microsoft прекращает поддержку офиса для Windows 10…
Сегодня компания Microsoft официально объявила о том, что перестанет поддерживать приложения Office (или …
Apple заняла лидирующую позицию на рынке ПК…
Согласно данным аналитической компании Canalys, компании Acer, Apple и Lenovo стали ведущими поставщиками…
Представлен стандарт HDMI 2.2 с поддержкой 10К-разрешения…
Организация HDMI Forum представила новую спецификацию HDMI 2.2 на ежегодной выставке CES 2025 — в пресс-р…
Mac Pro в корпусе мусорного ведра исполнилось 11 лет…
Оригинальный Mac Pro всегда отличался стандартным башенным корпусом, напоминающим привычные компьютеры, н…
В Windows 11 появился ИИ-поиск…
Судя по информации западных инсайдеров, компания Microsoft тестирует новый поиск на базе искусственного и…
LG предлставит сразу два новых проектора…
Компания LG представит на выставке CES 2025 сразу два универсальных проектора для современного интерьера …
Lenovo выпустила первые десктопные ПК на Snapdragon X…
Буквально вчера компания Qualcomm только анонсировала выход на рынок мини-ПК со своими Arm-процессорами, …
Lenovo представила консоль Legion Go S…
В мае текущего года Lenovo станет первой компанией, которая выпустит портативный игровой ПК (речь о новин…
МегаОбзор
ЭЛ № ФС 77 - 68301. Выходные данные СМИ МегаОбзор
2006-2025
© MegaObzor