OpenAI Meluncurkan Sora, Dapat Menghasilkan Video dari Teks

OpenAI merilis AI generatif bernama Sora yang bisa membuat video. (Sumber: OpenAI)

Techverse.asia - OpenAI hari ini resmi meluncurkan Sora, model AI generatif yang dapat membuat video beresolusi tinggi dari teks yang dimasukkan (input), durasi video yang dihasilkan maksimal satu menit. Sora, yang berarti 'langit' dalam bahasa Jepang, tidak akan tersedia untuk masyarakat umum dalam waktu dekat.

Sebaliknya, OpenAI menyediakannya bagi sekelompok kecil akademisi dan peneliti yang akan menilai bahaya dan potensi penyalahgunaannya.

Dengan deskripsi singkat - atau mendetail - atau gambar diam, Sora dapat menghasilkan adegan seperti film 1080 piksel dengan banyak karakter, jenis gerakan berbeda, dan detail latar belakang. Sora juga dapat memperluas klip video yang ada - melakukan yang terbaik untuk mengisi detail yang hilang.

Sora memiliki pemahaman bahasa yang mendalam, memungkinkannya menafsirkan perintah secara akurat dan menghasilkan karakter menarik yang mengekspresikan emosi yang hidup. Model ini memahami tidak hanya apa yang diminta pengguna dalam prompt, tetapi juga bagaimana hal-hal tersebut ada di dunia nyata,” tulis OpenAI dalam postingan blognya disadur Techverse.asia pada Jumat (16/2/2024).

Baca Juga: Infinix Hot 40 Series Segera Dipasarkan di Indonesia, Ini Bocoran Speknya

Sekarang, ada banyak kejutan di halaman demo OpenAI untuk Sora - pernyataan di atas adalah contohnya. Namun demikian, sampel pilihan dari model tersebut memang terlihat cukup mengesankan, setidaknya dibandingkan dengan teknologi teks-ke-video lain yang pernah ada hingga kini.

Sebagai permulaan, Sora dapat menghasilkan video dalam berbagai gaya (misalnya fotorealistik, animasi, hitam putih) hingga satu menit - jauh lebih lama daripada kebanyakan model teks-ke-video.

Dan video-video ini menjaga koherensi yang masuk akal, dalam arti bahwa mereka tidak selalu menyerah pada apa yang disebut sebagai keanehan AI, seperti objek yang bergerak ke arah yang secara fisik tidak mungkin dilakukan.

“(Sora) mungkin kesulitan dalam melakukan simulasi fisika dari adegan kompleks secara akurat, dan mungkin tidak memahami contoh sebab dan akibat yang spesifik. Misalnya, seseorang mungkin menggigit kue, tetapi setelah itu, kue tersebut mungkin tidak memiliki bekas gigitan.”

Baca Juga: Google Memperkenalkan Gemini 1.5

“Model ini mungkin juga mengacaukan detail spasial dari suatu perintah, misalnya, tercampurnya kiri dan kanan, dan mungkin kesulitan dalam mendeskripsikan secara tepat peristiwa yang terjadi seiring waktu, seperti mengikuti lintasan kamera tertentu,” jelas OpenAI.

OpenAI sangat memposisikan Sora sebagai pratinjau penelitian, mengungkapkan sedikit tentang data apa yang digunakan untuk melatih model (kurang dari lebih dari 10 ribu jam video berkualitas tinggi) dan tidak membuat Sora tersedia secara umum.

Alasannya adalah adanya potensi penyalahgunaan; OpenAI dengan tepat menunjukkan bahwa pelaku kejahatan dapat menyalahgunakan model seperti Sora dengan berbagai cara.

OpenAI mengatakan bahwa pihaknya bekerja sama dengan para ahli untuk menyelidiki model eksploitasi dan membangun alat untuk mendeteksi apakah suatu video dibuat oleh Sora.

Baca Juga: Microsoft Resmi Luncurkan Copilot: Gabungkan Konteks dan Kecerdasan Web

Perusahaan menambahkan, jika mereka memilih untuk membuat model menjadi produk publik, mereka akan memastikan bahwa metadata asal disertakan dalam keluaran yang dihasilkan.

“Kami akan melibatkan para pembuat kebijakan, pendidik, dan seniman di seluruh dunia untuk memahami kekhawatiran mereka dan mengidentifikasi kasus-kasus positif penggunaan teknologi baru ini,” tulis OpenAI.

“Meskipun telah dilakukan penelitian dan pengujian yang ekstensif, kami tidak dapat memprediksi semua manfaat yang akan diperoleh orang dalam menggunakan teknologi kami, atau semua cara orang akan menyalahgunakannya,” papar perusahaan yang dipimpin Sam Altman ini.

Namun, Sora bukanlah model teks-ke-video pertama yang ada. Perusahaan lain termasuk Meta, Google dan Runway, telah memperkenalkan alat teks-ke-video atau menyediakannya untuk umum. Meski begitu, saat ini belum ada alat lain yang mampu menghasilkan video berdurasi 60 detik.

Baca Juga: 7 Prediksi dan Tren Teknologi Tentang Kecerdasan Buatan pada 2024

Maraknya alat teks-ke-video telah memicu kekhawatiran akan potensi alat tersebut untuk lebih mudah membuat rekaman palsu yang tampak realistis.

“Saya benar-benar takut hal semacam ini akan mempengaruhi pemilihan umum (pemilu di Amerika Serikat) yang diperebutkan secara ketat,” ungkap Oren Etzioni, seorang profesor di Universitas Washington yang berspesialisasi dalam kecerdasan buatan, dan pendiri True Media, sebuah organisasi yang bekerja untuk mengidentifikasi disinformasi dalam kampanye politik.

Dan AI generatif secara lebih luas telah memicu reaksi balik dari para seniman dan profesional kreatif yang khawatir dengan penggunaan teknologi untuk menggantikan pekerjaan manusia.

Baca Juga: Meta Meluncurkan Fitur AI Generatif untuk Pengiklan

Tags :
BERITA TERKAIT
BERITA TERKINI