Techverse.asia - Model kecerdasan buatan (AI) pembuat video terbaru dari Google yaitu Veo 3, kini dapat membuat audio yang sesuai dengan klip yang dibuatnya. Veo 3 sejatinya merupakan iterasi pertama dari model yang dapat membuat video dengan suara.
Perusahaan raksasa teknologi tersebut mengklaim bahwa Veo 3 dapat membuat efek suara, suara latar, dan bahkan dialog untuk mengiringi video yang dibuatnya. Veo 3 juga diklaim lebih baik dari pendahulunya, Veo 2, dalam hal kualitas rekaman yang dapat dibuatnya.
Baca Juga: Meta Umumkan 2 Fitur Anyar Guna Membantu Tuna Netra
Misalnya, Google Veo 3 dapat membuat video burung dengan audio kicauannya, atau jalan kota dengan suara lalu lintas di latar belakang. Google menyatakan bahwa Veo 3 juga unggul dalam fisika dunia nyata dan sinkronisasi bibir.
Saat ini, model tersebut hanya tersedia untuk pelanggan Gemini Ultra di Amerika Serikat (AS) dalam aplikasi Gemini dan untuk pengguna perusahaan di Vertex AI. Untuk bisa mengaksesnya, pelanggan Gemini harus membayar US$250 atau setara dengan Rp4 jutaan per bulan.
Selain itu, Veo 3 juga tersedia di Flow, alat pembuat film bertenaga kecerdasan buatan terbaru dari Google.
Baca Juga: Tiga AI Generatif Baru dari Google untuk Berkreasi: Veo, Imagen 3 dan Lyria
"Untuk pertama kalinya, kita bangkit dari era video yang sunyi. (Pengguna dapat memberi Veo 3) perintah yang menjelaskan karakter dan lingkungan, dan menyarankan dialog dengan deskripsi tentang bagaimana kalian ingin dialog itu terdengar," kata CEO Google DeepMind, Divisi R&D AI Google Demis Hassabis kami kutip, Rabu (28/5/2025).
Meskipun Google telah merilis model pembuatan video yang benar-benar baru, mereka belum sepenuhnya meninggalkan Veo 2 begitu saja. Pengguna akan dapat memberi Veo 2 gambar orang, adegan, gaya, dan objek untuk digunakan sebagai referensi untuk hasil yang mereka inginkan di Flow.
Mereka juga akan memiliki akses ke kontrol kamera yang akan memungkinkan untuk memutar adegan dan memperbesar objek tertentu untuk Flow.
Ditambah lagi, mereka akan dapat memperluas bingkai dari potret ke lanskap jika mereka mau dan menambahkan atau menghapus objek dari video mereka. Google mengatakan bahwa semua kemampuan Veo 2 baru ini akan hadir di platform API AI Vertex dalam beberapa minggu mendatang.
Baca Juga: Startup xAI Resmi Akuisisi Hotshot: Pembuat Video AI Generatif
Di sisi lain, sementara perusahaan seperti Google mempromosikan Veo 3 sebagai alat kreatif yang hebat, banyak seniman tentu waspada terhadapnya - alat tersebut mengancam akan menjungkirbalikkan seluruh industri.
Sebuah studi tahun 2024 yang ditugaskan oleh Animation Guild, sebuah serikat pekerja yang mewakili animator dan kartunis Hollywood, memperkirakan bahwa lebih dari 100 ribu pekerjaan film, televisi, dan animasi berbasis di AS akan terganggu oleh AI pada tahun depan.
Ketersediaan alat yang luas untuk membangun generator video tersebut juga telah menyebabkan ledakan penyedia sehingga ruang tersebut menjadi jenuh.
Google sebetulnya bukan yang pertama dalam terobosan tersebut, seban perusahaan rintisan termasuk Runway, Lightricks, Genmo, Pika, Higgsfield, Kling, dan Luma, serta raksasa teknologi seperti OpenAI dan Alibaba, merilis model dengan cepat. Dalam banyak kasus, sedikit yang membedakan satu model dari model lainnya.
Baca Juga: Google Hadirkan Bahasa Desain Android Barunya: Material 3 Expressive
Output audio menjadi pembeda besar untuk Veo 3, jika Google dapat memenuhi janjinya. Alat pembangkit suara bertenaga kecerdasan buatan bukanlah hal baru, begitu pula model untuk membuat efek suara video.
Namun, Veo 3 secara unik dapat memahami piksel mentah dari videonya dan menyinkronkan suara yang dihasilkan dengan klip secara otomatis.
Veo 3 kemungkinan dimungkinkan oleh karya DeepMind sebelumnya dalam AI video-ke-audio. Pada Juni 2024, DeepMind mengungkapkan bahwa mereka sedang mengembangkan teknologi AI untuk menghasilkan soundtrack untuk video dengan melatih model pada kombinasi suara dan transkrip dialog serta klip video.