Film paling awal yang masih bertahan, Pemandangan Taman Roundhay (1888), hanya menampilkan dua detik orang berjalan di halaman. Saat ini, AI siap untuk membuat video on demand dalam skala yang tidak terbayangkan beberapa dekade lalu. Kemitraan baru antara Disney dan OpenAI menandai datangnya masa depan ini: mulai tahun 2026, Sora OpenAI akan menghasilkan video yang menampilkan karakter Disney, Marvel, Pixar, dan Star Wars, yang disiarkan langsung di Disney+.
Ini bukanlah mimpi yang jauh. Disney menginvestasikan $1 miliar ke OpenAI untuk membangun “pengalaman baru” bagi pelanggan, termasuk konten buatan AI yang dapat mereka buat sendiri. Bayangkan meminta adegan Elsa dan Cinderella melawan Maleficent—klip yang bisa dikirimkan dalam hitungan detik.
Dari Detik ke Streaming: Evolusi Video AI
Kemajuan dari video AI berdurasi satu detik pada tahun 2016 hingga potensi film berdurasi penuh sungguh luar biasa. Sinema awal pernah dianggap sebagai “keingintahuan yang bodoh”, sama seperti beberapa orang yang sekarang menganggap video AI sebagai hal yang sia-sia. Namun, skeptisisme yang sama muncul terhadap film-film awal sebelum The Great Train Robbery (1903) dan Gone with the Wind membuktikan kekuatan film tersebut.
Tantangannya terletak pada kompleksitas teknis pembuatan video. Sistem AI saat ini mengandalkan difusi, menyaring “noise” menjadi gambar yang koheren melalui pemrosesan berulang. Setiap penyempurnaan meningkatkan biaya komputasi, terutama dengan video: jutaan piksel harus diubah secara mulus di seluruh bingkai untuk menghindari gangguan seperti hilangnya cangkir kopi atau perubahan fitur wajah. OpenAI mengatasi hal ini dengan mengompresi video menjadi bingkai yang disederhanakan, lalu membagi bingkai tersebut menjadi kubus untuk mengoordinasikan keluaran model – serupa dengan cara ChatGPT menghubungkan kata-kata dalam respons.
Jalan Menuju Video AI yang Skalabel
Menghasilkan video yang lebih panjang jauh lebih sulit. Inkonsistensi terakumulasi dengan setiap frame yang ditambahkan. AI TV “on-demand” yang sebenarnya memerlukan pemotongan antar adegan yang efisien, yang saat ini sangat sulit dilakukan dalam skala besar.
Namun, para peneliti menemukan cara untuk mengurangi biaya. Salah satu pendekatannya adalah pembuatan frame-by-frame, yang membatasi komputasi yang diperlukan untuk setiap langkah. Tianwei Yin dari Reve percaya bahwa video AI berdurasi lima menit akan dapat dilakukan pada tahun depan, dan klip berdurasi satu jam akan segera menyusul setelahnya. CEO Google Sundar Pichai bahkan memperkirakan siswa sekolah menengah akan membuat film AI berdurasi panjang di tahun-tahun mendatang. CEO Runway Cristóbal Valenzuela setuju, dengan menyatakan bahwa video AI yang konsisten berdurasi 60–90 menit “segera” dapat dibuat.
Ekonomi Produksi Video AI
Beban keuangannya signifikan, namun berkurang. Sama seperti biaya bandwidth yang anjlok dari $1.200 per Mbps pada tahun 1998 menjadi $0,05 per Mbps pada tahun 2025, memungkinkan layanan streaming seperti Disney+, biaya teknologi AI kemungkinan akan turun seiring dengan peningkatan produksi dan pelatihan. Jutaan orang sudah terlibat dalam pengembangan model AI, dan peningkatan efisiensi tidak bisa dihindari.
Pergeseran ini memerlukan penanganan terhadap implikasi etika dan finansial, termasuk memberikan kompensasi kepada para kreatif yang karyanya melatih model-model ini. Namun, lintasannya jelas: Video yang dihasilkan AI bukan lagi pertanyaan tentang jika, namun kapan. Masa depan dunia hiburan akan segera dibentuk oleh algoritme, yang menawarkan kontrol yang belum pernah ada sebelumnya kepada penonton atas pengalaman menonton mereka.

















