Icono del sitio Robotitus

Google desarrolla una IA que genera imágenes de alta resolución a partir de imágenes de baja calidad

Imagen mejorada de una imagen de baja resolución / Brain Team Google

Como en las series policiacas más alucinantes, ahora existe una inteligencia artificial (IA) capaz de mejorar increíblemente las imágenes de baja resolución. Ingenieros del Brain Team de Google presentaron dos modelos de difusión para generar imágenes de alta fidelidad. Los detalles fueron publicados en el blog del buscador.

El primero de estos modelos es la superresolución de la imagen a través del refinamiento repetido o SR3. El equipo define este método como un modelo de difusión de superresolución que toma como entrada una imagen de baja resolución y “crea una imagen de alta resolución correspondiente a partir de ruido puro”.

La máquina utiliza un proceso de corrupción de imagen en el que el ruido se agrega constantemente a una imagen de alta resolución hasta que solo queda ruido puro. Luego invierte el proceso que lo elimina y alcanza una distribución objetivo “a través de la guía de la imagen de entrada de baja resolución”.

Algunos de los resultados mostrados por el equipo de investigación de Google son impresionantes. Muestran cómo el método mejora de manera eficaz la calidad de imagen de las imágenes de baja resolución. Además, la superresolución puede ser usada para mejorar los sistemas de imágenes médicas existentes o restaurar viejos retratos.

El segundo modelo

El segundo modelo recibe el nombre de difusión en cascada (CDM) y funciona como «un modelo de difusión condicional de clase entrenado en datos de ImageNet para generar imágenes naturales de alta resolución».

Según la publicación, el Brain Team construyó CDM como «una cascada de múltiples modelos de difusión», ya que ImageNet era un conjunto de datos difícil y de alta entropía. El modelo es una combinación de múltiples modelos de difusión que pueden generar imágenes de resolución creciente.

El proceso comienza con un modelo de difusión estándar con la resolución más baja y va seguido de una secuencia de modelos de superresolución, los cuales mejoran la imagen de forma sucesiva y agregan detalles de mayor resolución.

Mejoramiento de la calidad de imagen usando CDM

Aplicaciones y novedades

Junto con SR3, Google también utiliza una nueva técnica de aumento de datos, llamada aumento de acondicionamiento. Los investigadores de Brain Team afirman que mejora aún más los resultados de calidad de la muestra de CDM. Usando el método CDM, una imagen de baja resolución de 64×64 se puede difundir a una resolución de 264×264 y finalmente a 1024×1024.

Con la introducción de estos modelos, Google busca mejorar la síntesis de imágenes naturales, que a menudo plantea desafíos de diseño. Los autores aseguran que con SR3 y CDM han “llevado el rendimiento de los modelos de difusión al estado de la técnica en los puntos de referencia de generación ImageNet de superresolución y condicional de clase”.

Google promete mucho más de sus nuevos motores de inteligencia artificial y tecnologías asociadas. “Estamos entusiasmados de seguir probando los límites de los modelos de difusión para una amplia variedad de problemas de modelado generativo”, explica el buscador.

Salir de la versión móvil