Inteligencia Artificial · 2 min read · Dec 12, 2025

El nuevo bot de IA de Microsoft crea dibujos basados en descripciones de texto

La nueva herramienta de IA de Microsoft dibuja imágenes hermosas a partir de texto

La tecnología de Inteligencia Artificial (IA) ha evolucionado increíblemente en los últimos años y se considera que es la próxima gran cosa del futuro.

Avanzando más en esa dirección está Microsoft Corp., que ha estado invirtiendo en múltiples proyectos relacionados con la IA. El gigante tecnológico ha creado una nueva herramienta de IA que llama “bot de dibujo” utilizando una Red Generativa Antagónica (GAN) que funciona con dos modelos de aprendizaje automático. El bot utiliza la GAN para generar imágenes basadas únicamente en un pie de foto descriptivo.

Un modelo de aprendizaje automático genera imágenes a partir de descripciones de texto, mientras que el otro modelo, conocido como discriminador, utiliza descripciones de texto para juzgar la autenticidad de las imágenes generadas, de modo que no pueda ser engañado. Trabajando juntos, el discriminador empuja al generador hacia la perfección. Al utilizar la técnica GAN, la IA presta mucha atención a palabras individuales al generar imágenes a partir de descripciones de texto similares a un pie de foto, logrando así un aumento triple en la calidad de la imagen en comparación con el método anterior de texto a imagen.

Según Microsoft, el bot es incluso capaz de imaginar detalles mientras dibuja que no se mencionan específicamente en el texto, lo que indica que la IA contiene una “imaginación artificial”.

Por ejemplo, la imagen a continuación fue creada por el bot de dibujo simplemente a partir de la descripción de “un pájaro con un cuerpo amarillo, alas negras y un pico corto.” Aunque no se especifica en el texto dado, la IA eligió colocar al pájaro en una rama utilizando su imaginación artificial. No solo pájaros, la herramienta de IA puede dibujar cualquier cosa, desde escenas ordinarias del campo, como ganado pastando, hasta lo bizarro, como un autobús de dos pisos flotante.

“Si vas a Bing y buscas un pájaro, obtienes una imagen de un pájaro. Pero aquí, las imágenes son creadas por la computadora, píxel por píxel, desde cero,” dijo Xiaodong He, un investigador principal y gerente de investigación en el Centro de Tecnología de Aprendizaje Profundo en el laboratorio de investigación de Microsoft en Redmond, Washington, en un informe sobre el proyecto. “Estos pájaros pueden no existir en el mundo real — son solo un aspecto de la imaginación de nuestra computadora sobre los pájaros.”

El investigador de Microsoft, Pengchuan Zhang, dijo sobre la investigación: “Necesitas que tus algoritmos de aprendizaje automático ejecuten tu inteligencia artificial para imaginar algunas partes faltantes de las imágenes. A partir de los datos, el algoritmo de aprendizaje automático aprende este sentido común sobre dónde debería pertenecer el pájaro.”

El informe de investigación, que aún debe someterse a revisión científica, podría actuar como un asistente de boceto para pintores y diseñadores de interiores, dice Microsoft. El Sr. He imagina que la tecnología podría generar películas animadas basadas en guiones, lo que ‘aumentaría el trabajo que hacen los cineastas de animación’ al eliminar parte del trabajo manual involucrado.

Share: X/Twitter LinkedIn

Recibe nuevas publicaciones en tu bandeja de entrada.

No spam. Cancela la suscripción en cualquier momento.