TechFusion.ruНовостиВ Microsoft создали нейросеть AttnGAN, которая умеет рисовать «на заказ»

В Microsoft создали нейросеть AttnGAN, которая умеет рисовать «на заказ»

AttnGAN
Екатерина Рыбачёк

Екатерина Рыбачёк

Новостной редактор TechFusion.ru,
гедонист, оптимист,
любитель котиков и технологий
Екатерина Рыбачёк

Новый искусственный интеллект AttnGAN, созданный специалистами корпорации Microsoft, умеет рисовать картины по их текстовому описанию. Алгоритм учитывает все «пожелания» к картине и создает довольно качественное изображение

Новая порождающая состязательная нейросеть разработчиков Microsoft умеет рисовать изображения на основе их краткого текстового описания. Алгоритм, учитывающий основные детали описания, подробно описан в статье AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks на сайте библиотеки Корнеллского университета.

Нейросеть обучали на базе данных изображений птиц CUB и базе данных изображений с текстовым описанием COCO. В первом случае эффективность созданий картин «на заказ» превысила стандартные показатели на 14,14%. Во втором случае эффективность новой нейросети превзошла уже имеющиеся алгоритмы на 170,25%.

AttnGAN

Изображение, нарисованное AttnGAN по запросу «птица с зеленой головой, черным телом и белым животом». Иллюстрация: arxiv.org

Для разработки искусственного интеллекта специалисты использовали attentional GAN. Она генерируют изображения из целого описания, учитывая все детали, не выделяя разных направлений для выполнения алгоритма. Подобный подход позволяет нейросети создавать реалистичные изображения. Разработчики подчеркивают важность «внимательности» GAN, которая открывает новые возможности не только в создании изображений.

Фото на обложке: pixabay.com