La generación de imágenes por Inteligencia Artificial ha avanzado a pasos agigantados. Sin embargo, un problema persiste: el llamado ‘aspecto IA’. Este se manifiesta en imágenes con características particulares que las hacen fácilmente identificables como generadas por una IA, restándoles autenticidad.
¿Qué es el ‘Aspecto IA’ y por qué ocurre?
El ‘aspecto IA’ se refiere a una serie de características visuales comunes en imágenes generadas por IA, tales como:
- Piel cerosa y poco natural.
- Fondos excesivamente borrosos con efecto bokeh.
- Colores brillantes, pero irreales.
- Composiciones planas y carentes de dinamismo.
Este fenómeno no es accidental, sino una consecuencia de cómo se entrenan y evalúan los modelos de IA. Según el artículo original de GenBeta, los principales factores que contribuyen al ‘aspecto IA’ son:
- Obsesión con lo medible: Se priorizan métricas técnicas (FID, CLIP Score) que evalúan la precisión (manos con cinco dedos, texto legible) por encima de la estética y la naturalidad.
- Filtros estéticos predefinidos: Los ‘evaluadores’ automáticos (LAION-Aesthetics, Pickscore) utilizados durante el entrenamiento favorecen ciertos estilos (retratos de mujeres jóvenes, fondos borrosos, pieles perfectas, escenas muy iluminadas), sesgando el resultado.
- Mezcla de estilos: Al combinar opiniones diversas en la fase de ajuste fino, se obtiene un estilo promedio y poco atractivo.
- Soluciones parciales: El uso de prompts extensos o modelos LoRA puede mejorar el resultado, pero requiere conocimientos especializados.
FLUX.1-Krea: El Enfoque de los Modelos ‘Opinados’
Krea y Black Forest Labs proponen una solución innovadora: los modelos ‘opinados’. En lugar de buscar un estilo genérico, estos modelos se entrenan con un gusto estético muy definido. Es decir, en vez de intentar complacer a todos, se centran en ofrecer un estilo único y distintivo.
El proceso de Krea se divide en tres etapas:
- Preentrenamiento: El modelo aprende de una amplia variedad de estilos, elementos e incluso ejemplos de ‘malas imágenes’ para identificar qué evitar.
- Postentrenamiento: Se refina el gusto del modelo mediante Supervised Finetuning (SFT), utilizando imágenes de alta calidad que se ajustan al estilo deseado, y Reinforcement Learning from Human Feedback (RLHF), donde expertos eligen las imágenes que mejor representan la estética buscada.
- Estilo definido: Krea evita mezclar diferentes gustos durante el entrenamiento, enfocándose en una estética específica que se convierte en su ‘firma’.
Resultados y Perspectivas
En pruebas comparativas, FLUX.1-Krea ha demostrado generar imágenes más naturales y creíbles en comparación con modelos como GPT-4.1, que tienden a producir el típico ‘aspecto IA’.
La tendencia hacia modelos ‘opinados’ sugiere un futuro donde la IA generativa ofrezca mayor diversidad creativa y se adapte a las necesidades específicas de estudios, marcas y artistas.
Conclusión
El ‘aspecto IA’ es un desafío real en la generación de imágenes. FLUX.1-Krea propone una solución interesante al apostar por modelos con gustos estéticos definidos. Este enfoque promete imágenes más auténticas y diversas, abriendo nuevas posibilidades creativas en el mundo de la IA.
Fuente: GenBeta
Leave a Comment