Компания Google представила свой новый проект под названием Imagen — это генератор изображений по заданному текстовому описанию.
По словам разработчиков, нейросеть Imagen превосходит DALL-E 2 от OpenAI, еще один генератор изображений с искусственным интеллектом. На данный момент Imagen недоступна для публики, но представленные образцы впечатляют.
Как отмечают в Google, новая модель преобразования текста в изображение характеризуется «беспрецедентной степенью фотореализма и глубоким пониманием языка».
Google представила изображения и образцы работ Imagen, стили которых варьируются от простых рисунков до картин маслом и компьютерной графики. Они сопровождаются словами и фразами, используемыми при их создании.
Разобрав предоставленное текстовое описание, Imagen генерирует изображение размером 64 x 64 пикселя, затем выполняет два последовательных улучшения и преобразует изображение в более крупный размер 1024 x 1024 пикселя.