Новый ИИ-бот Microsoft создает рисунки на основе текстовых описаний

Новый инструмент ИИ от Microsoft рисует красивые изображения из текста

Технология Искусственного Интеллекта (ИИ) невероятно развилась за последние несколько лет и считается следующим большим шагом в будущем.

Двигаясь в этом направлении, компания Microsoft Corp. инвестирует в множество проектов, связанных с ИИ. Технический гигант создал новый инструмент ИИ, который он называет «ботом для рисования», используя Генеративную Состязательную Сеть (GAN), работающую на двух моделях машинного обучения. Бот использует GAN для генерации изображений, основываясь лишь на описательном заголовке.

Одна модель машинного обучения генерирует изображения из текстовых описаний, в то время как другая модель, известная как дискриминатор, использует текстовые описания для оценки подлинности сгенерированных изображений, чтобы ее не обманули. Работая вместе, дискриминатор подталкивает генератор к совершенству. Используя технику GAN, ИИ уделяет особое внимание отдельным словам при генерации изображений из текстовых описаний, тем самым достигая трехкратного повышения качества изображений по сравнению с предыдущим методом текст-в-изображение.

По словам Microsoft, бот даже способен вообразить детали при рисовании, которые не упоминаются в тексте, что указывает на то, что ИИ обладает «искусственным воображением».

Например, изображение ниже было создано ботом для рисования просто на основе описания «птица с желтым телом, черными крыльями и коротким клювом». Хотя в данном тексте это не указано, ИИ решил разместить птицу на ветке, используя свое искусственное воображение. Не только птицы, инструмент ИИ может рисовать все, от обычных сельских сцен, таких как пасущиеся скот, до странного, например, плавающего двухэтажного автобуса.

«Если вы зайдете в Bing и поищете птицу, вы получите изображение птицы. Но здесь изображения создаются компьютером, пиксель за пикселем, с нуля», — сказал Сяодун Хэ, главный исследователь и менеджер исследований в Центре технологий глубокого обучения в исследовательской лаборатории Microsoft в Редмонде, штат Вашингтон, в отчете о проекте. «Эти птицы могут не существовать в реальном мире — они просто аспект воображения нашего компьютера о птицах.»

Исследователь Microsoft Пэнчуан Чжан сказал о исследовании: «Вам нужны ваши алгоритмы машинного обучения, работающие с вашим искусственным интеллектом, чтобы вообразить некоторые недостающие части изображений. Из данных алгоритм машинного обучения учится этому здравому смыслу, где должна находиться птица.»

Исследовательский отчет, который еще не прошел научную проверку, может стать помощником для художников и дизайнеров интерьеров, говорит Microsoft. Мистер Хэ предполагает, что технология может генерировать анимационные фильмы на основе сценариев, что «дополнит работу анимационных режиссеров», устраняя часть ручного труда, связанного с этим.

Новый инструмент ИИ от Microsoft рисует красивые изображения из текста

Get new posts in your inbox