Представлена новая модель нейросети для генерации изображений от Сбера -Kandinsky 2.1

Вчера (4 апреля 2023 года) была представлена новая улучшенная версия модели для создания высококачественных изображений по текстовому описанию Kandinsky 2.1 от Сбера.

Милый котик слушает музыку в наушниках._Kandinsky 2.1

Отличительная особенность — это поддержка русского языка.

Отличительные особенности:

— 3.3B параметров

— Разрешение генераций — 768×768

— Image prior трансформер

— Новый автоэнкодер изображений MoVQ

— Дообучение на очень чистом сете из 172M пар «текст-изображение»

— Режимы работы: генерация по тексту, смешивание изображение, генерация изображений по образцу, изменение изображений по тексту, inpainting/outpainting

Всё это позволило добиться впечатляющего качества на различных доменах генераций.

Подробнее о модели можно прочитать в статье на Хабре.

Протестировать возможности модели Kandinsky 2.1 от Сбера можно тут:

— Телеграм-бот

— FusionBrain.AI

— rudalle.ru

— MLSpace

— Kandinsky2.1

— Google Colab

— GitHub https://github.com/ai-forever/Kandinsky-2

— HuggingFace https://huggingface.co/sberbank-ai/Kandinsky_2.1

Сейчас наблюдается наплыв пользователей, поэтому время для генерации изображений увеличилось.