la empresa de investigacion IA abierta presentó el DALL·E original en 2021, pero refinó rápidamente el modelo a medida que los primeros usuarios experimentaban con la herramienta. DALL·E 2 llegó en la primavera de 2022, una serie de sistemas de IA que funcionan en conjunto. Uno es el modelo CLIP (Contrastive Language-Image Pre-Training) de OpenAI, una IA entrenada para identificar cientos de millones de imágenes y traducirlas en descripciones de texto. Cuando un ser humano solicita a DALL·E 2 una solicitud de imagen, CLIP funciona como un “codificador de texto”, lo que ayuda al sistema de inteligencia artificial a comprender y sintetizar elementos del mensaje humano.
A continuación, el sistema de IA analiza cientos de millones de imágenes clasificadas y comprimidas en el “espacio latente”, un reino oculto donde la IA agrupa millones de imágenes según sus similitudes. El espacio latente es un poco como Hanger 51 al final de “Raiders of the Lost Ark”. un almacén aparentemente interminable con artefactos clasificados en cajas de acuerdo con algún método arcano que es demasiado complejo de comprender. Finalmente, el sistema de IA aplica un “decodificador de imágenes” para traducir sus descubrimientos en un conjunto de 10 imágenes diferentes correspondientes al mensaje humano original. Los usuarios pueden incluso modificar estas imágenes generadas por IA con comandos de texto simples a través de funciones de pintura y edición.
DALL·E 2 solo está en modo de vista previa en este momento, abierto a un pequeño número de “usuarios de confianza” que ya han creado más de tres millones de imágenes. La empresa emplea filtros de texto y análisis automatizados para marcar las imágenes que infringen la política de la empresa. estricta política de contenido que solo permite “imágenes con clasificación G”. Los usuarios pueden perder el acceso si crean o distribuyen imágenes que reflejan odio, acoso, violencia, contenido para adultos, actividad ilegal, engaño o spam.
Más allá de las limitaciones de contenido, OpenAI tiene una política aún más estricta sobre los artistas que se benefician de las imágenes que crean, prohibiendo el uso de DALL·E 2 para crear NFT u otras formas comerciales de “licenciar, vender, intercambiar o realizar transacciones” de las imágenes generadas. “Personalmente, estoy muy entusiasmado con las NFT”, dijo Future cuando se le preguntó sobre los posibles escenarios para el futuro del arte generado por IA. “Cuanto más cercana sea la relación que podamos tener entre el creador y la audiencia, mejor. Quiero que mis suscriptores sean incentivados económicamente y recompensados solo por ser un seguidor. Pueden acompañarme en mi viaje.
Para los creadores que buscan más libertad, una comunidad de artistas y codificadores ha estado trabajando para ofrecer herramientas de código abierto para que las usen los creadores sin reglas de uso tan estrictas. Esta comunidad ha desarrollado herramientas de IA como CLIP Guided Diffusion, Disco Diffusion y Centipede Diffusion para utilizar y reproducir la funcionalidad de DALL·E 2. Esta comunidad ha sido pionera en el arte de la “ingeniería rápida” diseñar descripciones de texto óptimas para que la IA cree un mejor arte.
Chris Allen es un artista digital y músico obsesionado con este nuevo campo. Ha pasado meses trabajando con Disco Diffusion, una herramienta de código abierto que acepta mensajes de texto y utiliza la red neuronal de difusión guiada por CLIP de OpenAI para producir obras de arte personalizadas. Si bien los resultados no pueden igualar el desempeño de DALL·E 2, miles de artistas se han unido al Comunidad Disco Difusióncreación de imágenes digitales, videoarte y NFT.
“Eventualmente, habrá una continuidad”, me dijo Allen, mirando hacia un futuro en el que DALL·E 2 esté disponible para que lo usen todos los artistas. “Habrá acceso patrocinado por empresas con comunidades cerradas. Para OpenAI y otras empresas, ese será su negocio: inventar cosas geniales de aprendizaje automático y ponerlas a disposición por suscripción o contrato. Luego habrá esta larga serie de cosas experimentales locas”.
Allen escribió “Hoja de trucos de difusión disco de Zippy”, un manual en constante evolución que presenta a los artistas este popular sistema de IA de código abierto. “Me encanta hacer arte y me encanta compartir lo que he hecho”, dijo. “Me encanta ayudar a otras personas. Es una buena sensación saber que estoy ayudando a alguien a lograr sus objetivos, de la misma manera que alguien me ayudó a mí”.
Allen ha creado una serie de obras de arte digitales, NFT, videos y películas con temas de ciencia ficción. El me mostro “Cultivos hibridados”, una obra de arte creada con Disco Diffusion, así como herramientas de edición y animación digital. Ha acuñado 11 ediciones de este surrealista NFT. En el video en bucle sin fin, la cámara se mueve como un microscopio, acercándose más para revelar nanobots microscópicos que habitan las venas de una planta, vida orgánica e inorgánica que coexiste a nivel atómico. Allen pasó horas generando, refinando y uniendo estas imágenes en la computadora de su casa, aprovechando el poderoso poder de procesamiento de los servicios informáticos basados en la nube de Google. “Mucho digital es muy literal. Lo que pones es exactamente lo que obtienes”, concluyó Allen. “Con la IA, solo estás dirigiendo el caballo y esperando que vaya por el camino correcto. Es una experiencia muy liberadora”.