¿Cómo crear imágenes increíbles para tus clases con Bing y Dall-E utilizando solo palabras?
Los avances en Inteligencia Artificial (IA) continúan sorprendiéndonos. Uno de los desarrollos más interesantes de los últimos tiempos es la incorporación de Dall-E 3, el modelo de IA de generación de imágenes desarrollado por OpenAI, a Bing, el popular motor de búsqueda de Microsoft.
Esta integración marca un hito significativo en la búsqueda visual y la creación de imágenes, y promete cambiar la forma en que interactuamos con la información en línea.
Dall-E 3 es la última actualiación de la serie de modelos Dall-E de OpenAI, que se destacan por su capacidad para generar imágenes a partir de descripciones de texto. Nada más y nada menos.
Un gran avance que se basa en dos áreas principales de la IA: el aprendizaje profundo y el aprendizaje por refuerzo. Combina la habilidad del aprendizaje profundo para procesar datos jerárquicamente con la capacidad de aprendizaje por refuerzo para tomar decisiones secuenciales, lo que lo hace excepcionalmente versátil.
El creador de imágenes de Bing es de acceso gratuito
Hasta ahora, Dall-E 3 estaba disponible en una versión beta de pago, limitando su acceso a una audiencia selecta. Sin embargo, a partir del 6 de octubre de 2023, Bing ha hecho que Dall-E 3 esté disponible de forma gratuita para todos los usuarios. Esta decisión democratiza el acceso a una tecnología de vanguardia que tiene el potencial de cambiar la forma en que interactuamos con la web.
Un ejemplo divertido de cómo podemos utilizar Bing en clase
La forma en que Dall-E 3 opera en Bing es asombrosa en sí misma, y es realmente muy sencilla. Los usuarios simplemente deben ingresar una descripción de la imagen que desean en el generador de imágenes de Bing y listo.
La magia sucede cuando Dall-E 3 toma esta descripción y genera varias imágenes que coinciden con ella. Por su puesto, y como ya vimos en nuestro anterior artículo “Escribir para robots: Qué son los prompts y por qué deberías aprender a usarlos para no quedarte afuera del futuro”, el prompt (indicación, descripción) que le damos debe ser preciso. Cuanto más preciso mejor.
La incorporación de Dall-E 3 en Bing ofrece una serie de beneficios notables para los usuarios. En primer lugar, simplifica la búsqueda de imágenes al eliminar la necesidad de palabras clave específicas o términos de búsqueda complejos. Los usuarios pueden simplemente describir lo que desean ver, y Dall-E 3 hace el resto. Esto facilita la búsqueda de imágenes para una amplia gama de propósitos, desde proyectos creativos hasta investigaciones académicas.
Por eso, podemos utilizar la potencia cognitiva a la hora de aplicar lenguaje del Chatbot de Bing, que se basa en ChatGPT 4, para pedirle un promt que nos ayuda a obtener una imagen estilo Manga de José de San Martín Cruzando los Andes junto a los Granaderos a Caballo.
Las opciones son infinitas. Podemos pedirle, incluso, una imagen estilo Picasso.
Desde luego, es aquí cuando se pone en juego el conocimiento humano y el espíritu crítico. ¿El color y el estilo de la ropa que utilizan los soldados de la imagen es la correcta? ¿Realmente era así la el paisaje y el clima al momento de los tantos cruces que hizo San Martín?
Existen tantas preguntas como ajustes que se puede realizar sobre el promt para hacer cada vez más exacta y rigurosa la imagen creada.
[…] hecho, conociendo casos renombrados como el de la imagen del Papa con una campera blanca; y experimentando la creación de imágenes a partir de texto lanzada por Bing y OpenAI, es probable que en un futuro no muy lejano empecemos a preguntarnos qué cosa sí es […]