Disney і OpenAI відкривають еру потокового відео на основі ШІ

1

Найраніший із збережених фільмів, Сцена в саду Раундхей (1888), показує лише дві секунди людей, які йдуть подвір’ям. Сьогодні штучний інтелект готовий створювати відео на вимогу в масштабах, які неможливо було уявити лише кілька десятиліть тому. Нове партнерство між Disney і OpenAI сигналізує про це майбутнє: Починаючи з 2026 року Sora від OpenAI створюватиме відео з персонажами Disney, Marvel, Pixar і Star Wars, які транслюватимуться безпосередньо на Disney+.

Це не далека мрія. Disney інвестує 1 мільярд доларів у OpenAI, щоб створити «новий досвід» для передплатників, у тому числі контент, створений штучним інтелектом, який вони можуть створювати самі. Уявіть, що ви замовляєте сцену боротьби Ельзи та Попелюшки з Малефісентою — ролик, який можна доставити за секунди.

Від секунд до потокового передавання: еволюція відео, створеного штучним інтелектом

Прогрес від уривчастих односекундних відео, створених штучним інтелектом у 2016 році, до потенціалу повнометражних фільмів вражає. Ранній кінематограф колись висміювали як «дурне хобі», так само як дехто зараз висміює створене ШІ відео як трюк. Проте той самий скептицизм існував щодо ранніх фільмів до того, як «Велике пограбування поїзда» (1903) і «Віднесені вітром» довели свою життєздатність.

Проблема полягає в технічній складності створення роликів. Сучасні системи штучного інтелекту покладаються на дифузію, уточнюючи «шум» у когерентні зображення за допомогою багаторазової обробки. Кожне вдосконалення збільшує обчислювальні витрати, особливо для відео: мільйони пікселів повинні плавно змінюватися між кадрами, щоб уникнути таких збоїв, як зникнення чашок кави або зміна рис обличчя. OpenAI вирішує цю проблему, стискаючи відео у спрощені кадри, а потім розділяючи ці кадри для координації виводу моделі — подібно до того, як ChatGPT об’єднує слова у відповідь.

Шлях до масштабного відео, створеного штучним інтелектом

Створювати довші відео в геометричній прогресії складніше. Невідповідності накопичуються з кожним доданим кадром. Справжнє «відео на вимогу», створене штучним інтелектом, вимагатиме ефективних переходів між сценами, що зараз є непомірно дорогим у масштабі.

Однак дослідники знаходять способи зменшити витрати. Один із підходів полягає у створенні на основі кадру за кадром, обмежуючи обчислювальні ресурси, необхідні для кожного кроку. Tianwei Yin з Reve вважає, що п’ятихвилинні відео, згенеровані штучним інтелектом, стануть можливими вже наступного року, а невдовзі з’являться годинні відео. Генеральний директор Google Сундар Пічаї навіть прогнозує, що старшокласники в найближчі роки створюватимуть повнометражні фільми, створені штучним інтелектом. Генеральний директор Runway Крістобаль Валенсуела погоджується, кажучи, що 60-90-хвилинні консенсусні відео, згенеровані ШІ, стануть можливими «незабаром».

Економіка створення відео за допомогою ШІ

Фінансовий тягар великий, але зменшується. Подібно до того, як витрати на смугу пропускання впали з 1200 доларів США за Мбіт/с у 1998 році до 0,05 доларів США за Мбіт/с у 2025 році, дозволяючи такі потокові сервіси, як Disney+, витрати на технологію штучного інтелекту, ймовірно, впадуть із збільшенням виробництва та навчання. Мільйони людей уже залучені до розробки моделей штучного інтелекту, і підвищення ефективності неминуче.

Ця зміна вимагатиме вирішення етичних і фінансових наслідків, включаючи компенсацію для творців, чия робота тренує ці моделі. Однак траєкторія чітка: відео, створене штучним інтелектом, більше не залежить від якщо, а від коли. Майбутнє розваг незабаром може бути сформоване алгоритмами, що пропонують глядачам безпрецедентний контроль над переглядом.

Попередня статтяВажнейшие Образовательные Конференции 2026 Года
Наступна статтяБої колібрі: еволюційна війна в тропічному лісі