Keadaan AI generatif dalam video saat ini sering kali terasa seperti trik sulap “sekali pakai”. Pengguna memasukkan perintah teks, video diproduksi, dan jika hasilnya cacat—seperti anggota tubuh yang terdistorsi atau gerakan yang tidak wajar—pengguna tidak punya pilihan selain memulai dari awal dengan perintah baru. Pendekatan “kotak hitam” ini menciptakan penghalang bagi pencipta profesional yang membutuhkan ketelitian, bukan keberuntungan acak.
Cartwheel, startup animasi 3D baru, mencoba memutus siklus ini. Didirikan oleh veteran industri Andrew Carr (sebelumnya OpenAI) dan Jonathan Jarvis (sebelumnya Google), perusahaan ini membangun alat yang dirancang untuk mengotomatiskan pekerjaan teknis animasi sambil menyerahkan pengambilan keputusan kreatif di tangan seniman.
Masalah Data: Mengapa 3D Lebih Sulit Dari Teks
Meskipun model bahasa besar (LLM) dan generator gambar telah berkembang pesat karena ketersediaan teks dan gambar yang hampir tak terbatas di internet, data gerakan 3D jauh lebih sulit ditemukan.
Kelangkaan data 3D berkualitas tinggi menghadirkan hambatan besar bagi pengembangan AI. Berbeda dengan bahasa tertulis yang melimpah, data akurat mengenai bagaimana benda bergerak dalam ruang tiga dimensi relatif jarang. Menurut salah satu pendirinya, Jonathan Jarvis, kesulitan mendapatkan data ini “10 hingga 100 kali” lebih sulit dari perkiraan awal.
Untuk mengatasinya, Cartwheel tidak sekadar menghasilkan “piksel” (gambar datar); mereka memetakan biomekanik manusia. Model mereka bertujuan untuk menerjemahkan masukan 2D sederhana—seperti video seseorang menari—menjadi struktur kerangka 3D yang presisi dan realistis. Hal ini memungkinkan tingkat akurasi teknis yang tidak dapat ditandingi oleh generator video datar.
Melawan “Kesamaan AI” Melalui Kontrol Kreatif
Kritik umum terhadap AI generatif adalah kecenderungannya terhadap “kesamaan”—fenomena ketika konten yang dihasilkan dengan model yang sama mulai terlihat berulang dan tidak memiliki karakter yang berbeda.
Para pendiri Cartwheel berpendapat bahwa kurangnya variasi ini adalah akibat langsung dari kurangnya kontrol. Solusi mereka adalah menyediakan “lapisan kontrol”, bukan produk jadi.
- AI sebagai Alat Listrik: Daripada menghasilkan video final yang tidak dapat diubah, Cartwheel menghasilkan aset 3D yang dimaksudkan untuk dimanipulasi.
- Pengeditan Pasca-Generasi: Karena keluarannya berupa data 3D, kreator dapat menyesuaikan pencahayaan, menggerakkan sudut kamera, atau mengubah pose karakter setelah pembuatan awal selesai.
- Pertunjukan yang Dipersonalisasi: Dengan memungkinkan seniman untuk “mendorong dan menarik” pertunjukan, teknologi tidak lagi sekedar pengganti artis dan menjadi alat canggih untuk berekspresi.
Visi: Bercerita Terbuka
Tujuan utama Cartwheel lebih dari sekadar efisiensi; ini tentang mengaktifkan “pengisahan cerita terbuka.”
Dalam lanskap game dan media sosial yang berkembang pesat, permintaan akan konten melampaui kapasitas animasi manual tradisional. Cartwheel membayangkan masa depan di mana karakter tidak hanya memutar ulang loop yang telah direkam sebelumnya, tetapi juga didukung oleh model gerakan yang memungkinkan mereka bereaksi dan tampil secara real-time.
Para pendiri memperkirakan perubahan mendasar dalam alur kerja industri:
“Semua orang akan bekerja dalam 3D meskipun dibuat dalam 2D, meskipun hasil akhirnya hanya video 2D.”
Dengan berfokus pada “lapisan di bawah piksel”—gerakan dan struktur yang mendasarinya—Cartwheel berharap dapat menjembatani kesenjangan antara visi 2D pencipta dan realitas 3D dengan ketelitian tinggi.
Kesimpulan
Cartwheel berupaya mengubah AI generatif dari generator video statis menjadi mesin dinamis untuk gerakan 3D. Dengan memprioritaskan kontrol dan keakuratan biomekanik, mereka bertujuan untuk memastikan bahwa meskipun mesin menangani mekanika teknis, manusia tetap mempertahankan “selera” dan inti emosional dari cerita tersebut.
