Сбер создал нейросеть, способную генерировать изображения по текстам
Сбер представил новую нейросеть Kandinsky 2.0, способную создавать изображения по словесному описанию. Изображения генерируются с учётом 2 миллиардов различных параметров.
В настоящее время ИИ доступен на сайте FusionBrain, а также на «умных» устройствах Сбера по голосовой команде «Запусти художника».
По данным разработчиков, при создании Kandinsky2.0 использовался диффузионный подход, который отличается хорошими результатами практически во всех задачах. Интересно, что нейросеть способна создавать изображения по текстовому описанию, созданному на 101 языке. В список языков входят как распространённые, так и достаточно редкие, вроде монгольского.
Помимо прочего, Kandinsky2.0 способна генерировать изображения в 20 различных стилях, заменять на изображениях заданные части, а также дорисовывать уже готовое изображение.