VASA-1 de Microsoft: IA que Genera Avatares Hiperrealistas

VASA-1: IA que Genera Avatares Hiperrealistas de Microsoft
Tabla de Contenidos

¿Cómo funciona esta nueva tecnología de Microsoft?

VASA-1 es el resultado de un proceso minucioso de investigación y desarrollo. Los investigadores de Microsoft se propusieron capturar toda la gama de expresiones humanas, incluyendo movimientos naturales de la cabeza, para generar avatares parlantes increíblemente creíbles. Utilizando un enfoque 3D para capturar detalles faciales y movimientos en un espacio tridimensional, VASA-1 puede separar y controlar elementos como los rasgos faciales, la posición de la cabeza y las expresiones de manera individual. Esto permite un control detallado y la posibilidad de editar cada atributo por separado, logrando así un nivel de realismo sin precedentes en los avatares generados.

Lo que distingue a VASA-1 de otros modelos de IA es su capacidad para crear expresiones realistas con movimientos en un espacio definido. Mientras que otros sistemas simplemente sincronizan el movimiento de los labios con el audio, VASA-1 va más allá al considerar todas las dinámicas faciales posibles, como el movimiento de los labios, la expresión facial, la mirada y el parpadeo, como variables latentes. Este enfoque holístico en la modelación de la dinámica facial resulta en una generación de comportamientos de conversación emotivos y realistas.

¿Cuál es el proceso de entrenamiento de VASA-1?

VASA-1 es capaz de producir videos de alta calidad en una resolución de 512 x 512 píxeles a 45 fotogramas por segundo. Además, destaca por su eficiencia, ya que puede ejecutarse en un ordenador con una GPU NVIDIA RTX 4090. Esto significa que la generación de avatares hiperrealistas está al alcance de un amplio espectro de usuarios.

¿Cuáles son las aplicaciones de VASA-1 más allá de las fotografías reales?

La versatilidad de VASA-1 va más allá de las fotografías reales y se extiende a ilustraciones o pinturas. Incluso se ha demostrado su capacidad para aplicarse en obras de arte icónicas, como hacer que la Mona Lisa cante «Paparazzi». Es importante destacar que todos los ejemplos presentados se construyeron a partir de fotografías generadas con tecnologías como DALL-E 3 y StyleGAN2.

¿Cuáles son los posibles riesgos asociados a esta IA?

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Información básica sobre protección de datos Ver más

  • Responsable: Gianfranco Gullaci.
  • Finalidad:  Moderar los comentarios.
  • Legitimación:  Por consentimiento del interesado.
  • Destinatarios y encargados de tratamiento: No se ceden o comunican datos a terceros para prestar este servicio. El Titular ha contratado los servicios de alojamiento web a Hostinger que actúa como encargado de tratamiento.
  • Derechos: Acceder, rectificar y suprimir los datos.
  • Información Adicional: Puede consultar la información detallada en la Política de Privacidad.

Scroll al inicio
Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos y para fines de afiliación y para mostrarte publicidad relacionada con sus preferencias en base a un perfil elaborado a partir de tus hábitos de navegación. Contiene enlaces a sitios web de terceros con políticas de privacidad ajenas que podrás aceptar o no cuando accedas a ellos. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos.
Privacidad