Вчера (4 апреля 2023 года) была представлена новая улучшенная версия модели для создания высококачественных изображений по текстовому описанию Kandinsky 2.1 от Сбера.
Отличительная особенность — это поддержка русского языка.
Отличительные особенности:
— 3.3B параметров
— Разрешение генераций — 768×768
— Image prior трансформер
— Новый автоэнкодер изображений MoVQ
— Дообучение на очень чистом сете из 172M пар «текст-изображение»
— Режимы работы: генерация по тексту, смешивание изображение, генерация изображений по образцу, изменение изображений по тексту, inpainting/outpainting
Всё это позволило добиться впечатляющего качества на различных доменах генераций.
Подробнее о модели можно прочитать в статье на Хабре.
Протестировать возможности модели Kandinsky 2.1 от Сбера можно тут:
— MLSpace
— GitHub https://github.com/ai-forever/Kandinsky-2
— HuggingFace https://huggingface.co/sberbank-ai/Kandinsky_2.1
Сейчас наблюдается наплыв пользователей, поэтому время для генерации изображений увеличилось.
А Вы уже попробовали Kandinsky 2.1 от Сбера?