Me está gustando la competencia en los modelos de generación de imágenes a través de texto por IA. Hasta hace poco parece que Midjourney tenía ventaja frente al resto, por aquello de generar imágenes muy artísticas con poca información. Es cierto que Stable Diffusion ha mejorado en eso con su nueva versión SDXL, pero no le llega aún del todo. Dall-e parecía que no iba a presentar batalla, pero resurge con su versión Dall-e 3 en la que parece entender mejor los prompts de los usuarios. Digo “parece” porque yo lo he probado a través de Bing Images y no veo mucha mejora.
Pero por mucho que avancen en general he de reconocer que mi ojito derecho va a ser siempre todo lo que sea open de verdad, en este caso Stable Diffusion. Por que lo open genera cosas inesperadas, usos inesperados, y lo inesperado mola.
Es así como ha nacido una corriente que denominan “Controlismo“ que consiste en usar Stable Diffusion con ControlNet para generar imágenes que contienen otras imágenes o símbolos. Para muestra un botón:
— Pero David, eso no es nuevo ya se había hecho desde hace muchos años.
Es cierto que no es algo nuevo. Quizás uno de los referentes más antiguos sea el de “Todo es vanidad” realizado con 18 años por Charles Allan Gilbert en 1892.
Pero no es el único referente. Tenemos en la memoria unas cuantas realizadas por el prolífico Dalí.
Esta de abajo, de Dalí también, es para una campaña contra enfermedades venéreas durante la segunda guerra mundial. La idea es colar un mensaje como el que no quiere la cosa :-)
El uso comercial que se le ha dado a este tipo de imágenes no ha sido muy extendido.
Sí las hemos visto en carteles de películas, pero no con demasiada frecuencia.
También en portadas de discos.
El tema es que son trabajos difíciles de hacer por parte de cualquier artista. Y por eso creo que no los vemos demasiado. A pesar de ser en general obras más que interesantes. Llaman la atención, que es lo que normalmente queremos cuando hacemos algo artístico y más si tiene una vertiente comercial.
La teoría detrás de este tipo de ilustraciones es la teoría de Gestalt. Este movimiento se inició en Berlín en 1920 y lo que buscaba era intentar encontrar un sentido a cómo nuestras mentes perciben las cosas como un todo, en lugar de individualmente cada elemento. Si queremos buscar al padre del Controlismo seguramente sería precisamente la teoría de Gestalt.
Vuelvo a lo que estaba diciendo antes de que me interrumpieran.
El caso es que en Stable Diffusion podemos usar un complemento llamado ControlNet que nos permite guiar un poco la creación de la imagen. Hay varios tipos de complementos de ControlNet, cada uno realiza una operación diferente a partir de una referencia dada. No entraré en todos los tipos ya que cada día sale uno nuevo. El caso es que a alguien se le ocurrió entrenar una red de ControlNet para generar códigos QR. Pedir una imagen pasándole un código QR para que lo integre de alguna forma en la imagen final. Aquí un ejemplo:
Podéis hacer la prueba de lectura si queréis con él. Tendréis que alejaros un poco para que lo interprete. Veréis que os lleva a “https://qrcode.monster”
El caso es que es una aplicación interesante de ControlNet.
Pero a alguien se le ocurrió que podría pasarle a la red algo que no fuera un código QR, y así es cómo nació el #Controlism. En concreto se le ocurrió a este señor:
Lo que antes (podemos decir que desde hace siglos) era algo bastante complejo, ahora se ha vuelto algo realmente sencillo. Tiene su ciencia ya que se necesita cierta experiencia para que salga algo que no sea demasiado evidente y a la vez creíble, pero está al alcance de cualquiera que quiera echarle unas horas.
Hay gente que se ha dedicado a usarlo con logos de marcas.
O a escribir mensajes ocultos.
Me encanta el OBEY. Referencia evidente a John Carpenter.
Las posibilidades son infinitas. Yo mismo he hecho alguna prueba en una instalación en local de Stable Diffusion. Aquí unos ejemplos, unos más sutiles que otros:
Pero no hace falta complicarse tanto. Si has llegado hasta aquí y te apetece juguetear un poco con esta técnica te dejo un enlace para que puedas probarlo tu mismo.
Apuesto a que veremos usarlo a las marcas en no mucho tiempo. El movimiento ha saltado ya de la imagen al vídeo.
Despedida y cierre
Nada más. Espero no haberme hecho muy pesado. Hace bastante que no enviaba la newsletter y me apetecía explicar algo curioso que he aprendido durante el verano. Me ha gustado volver a escribir después de tanto tiempo. Un saludo a los que aún estéis por ahí.