Más allá del mensaje: cómo Cartwheel pretende dar a los animadores control sobre la IA generativa

12

El estado actual de la IA generativa en vídeo a menudo se siente como un truco de magia “de un solo uso”. Un usuario ingresa un mensaje de texto, se produce un video y, si el resultado es defectuoso (como extremidades distorsionadas o movimientos antinaturales), al usuario no le queda otra opción que comenzar de nuevo con un mensaje nuevo. Este enfoque de “caja negra” crea una barrera para los creadores profesionales que requieren precisión en lugar de suerte aleatoria.

Cartwheel, una nueva startup de animación 3D, está intentando romper este ciclo. Fundada por los veteranos de la industria Andrew Carr (antes de OpenAI) y Jonathan Jarvis (antes de Google), la compañía está creando herramientas diseñadas para automatizar el trabajo técnico pesado de la animación mientras deja la toma de decisiones creativas en manos del artista.

El problema de los datos: por qué el 3D es más difícil que el texto

Si bien los grandes modelos de lenguaje (LLM) y los generadores de imágenes han florecido debido a la disponibilidad casi infinita de texto e imágenes en Internet, los datos de movimiento 3D son mucho más difíciles de encontrar.

La escasez de datos 3D de alta calidad presenta un obstáculo importante para el desarrollo de la IA. A diferencia del lenguaje escrito, que es abundante, los datos precisos sobre cómo se mueven los cuerpos en el espacio tridimensional son relativamente raros. Según el cofundador Jonathan Jarvis, la dificultad de obtener estos datos fue “de 10 a 100 veces” más difícil de lo previsto inicialmente.

Para superar esto, Cartwheel no sólo genera “píxeles” (imágenes planas); están mapeando biomecánica humana. Sus modelos pretenden traducir entradas 2D simples, como un vídeo de alguien bailando, en estructuras esqueléticas 3D realistas y precisas. Esto permite un nivel de precisión técnica que los generadores de vídeo planos no pueden igualar.

Luchando contra la “identidad de la IA” mediante el control creativo

Una crítica común a la IA generativa es su tendencia hacia la “igualdad”, el fenómeno en el que el contenido producido por el mismo modelo comienza a parecer repetitivo y carece de carácter distintivo.

Los fundadores de Cartwheel argumentan que esta falta de variedad es resultado directo de la falta de control. Su solución es proporcionar una “capa de control” en lugar de un producto terminado.

  • La IA como herramienta eléctrica: En lugar de generar un vídeo final e inmutable, Cartwheel genera recursos 3D que deben ser manipulados.
  • Edición posgeneración: Debido a que la salida son datos 3D, los creadores pueden ajustar la iluminación, mover los ángulos de la cámara o modificar la pose de un personaje una vez completada la generación inicial.
  • Actuación personalizada: Al permitir que los artistas “empujen y tiren” de la actuación, la tecnología deja de ser un reemplazo para el artista y se convierte en una herramienta sofisticada de expresión.

La visión: narración abierta

El objetivo final de Cartwheel se extiende más allá de la mera eficiencia; se trata de permitir “narración abierta”.

En los paisajes en rápida evolución de los juegos y las redes sociales, la demanda de contenido está superando la capacidad de la animación manual tradicional. Cartwheel imagina un futuro en el que los personajes no solo reproducen bucles pregrabados, sino que funcionan con modelos de movimiento que les permiten reaccionar y actuar en tiempo real.

Los fundadores predicen un cambio fundamental en el flujo de trabajo de la industria:

“Todo el mundo trabajará en 3D incluso si está escrito en 2D, incluso si el resultado final es sólo vídeo 2D”.

Al centrarse en la “capa debajo de los píxeles”, el movimiento y la estructura subyacentes, Cartwheel espera cerrar la brecha entre la visión 2D de un creador y una realidad 3D de alta fidelidad.


Conclusión
Cartwheel busca transformar la IA generativa de un generador de videos estáticos a un motor dinámico para movimiento 3D. Al priorizar el control y la precisión biomecánica, su objetivo es garantizar que mientras las máquinas manejan la mecánica técnica, los humanos conserven el “gusto” y el corazón emocional de la historia.