OpenAI Hadirkan Kloning Suara

Uli Febriarni
Sabtu 30 Maret 2024, 12:46 WIB
Logo OpenAI (Sumber: OpenAI)

Logo OpenAI (Sumber: OpenAI)

Baca Juga: Beasiswa Digital Talent Scholarship Kembali Dibuka untuk 2.500 Orang! Begini Cara Daftarnya

OpenAI meluncurkan alat baru bertenaga kecerdasan buatan (AI), bernama Voice Engine. Ini merupakan alat kloning suara, yang menggunakan masukan teks dan satu sampel audio berdurasi 15 detik.

Dengan sampel itu, mesin cerdas OpenAI dapat menghasilkan ucapan yang terdengar alami, emosional, realistis, dan sangat mirip dengan pembicara aslinya.

"Voice Engine kali pertama dikembangkan oleh OpenAI pada akhir 2022, dan telah menggunakannya untuk mendukung suara preset yang tersedia di API text-to-speech, ChatGPT Voice dan Read Aloud," tulis OpenAI dalam blognya, dikutip Sabtu (30/3/2024).

Baca Juga: Nissan Akan Kenalkan 16 Mobil Listrik Barunya Pada 2026

Sebelum merilis Voice Engine, OpenAI telah mengujinya secara privat kepada kelompok kecil mitra terpercaya mereka, pada akhir 2023.

Lewat uji coba, OpenAI menemukan bahwa Voice Engine dapat ditujukan untuk manfaat kebaikan di berbagai industri.

  1. Membantu Anak-anak dalam Kegiatan Akademis

Adanya 'bantuan membaca' lewat suara kloning yang terdengar alami dan penuh emosi, ternyata bisa membantu anak-anak belajar dalam kegiatan akademis.

Age of Learning, sebuah perusahaan teknologi pendidikan yang didedikasikan untuk keberhasilan akademis anak-anak, telah menggunakan ini untuk menghasilkan konten sulih suara yang telah ditulis sebelumnya.

Mereka juga menggunakan Voice Engine dan GPT-4 untuk membuat respons yang dipersonalisasi dan real-time, dalam berinteraksi dengan siswa.

Dengan teknologi ini, Age of Learning mampu menciptakan lebih banyak konten untuk khalayak yang lebih luas.

  1. Menerjemahkan Konten

Voice Engine dapat membantu menerjemahkan konten, seperti video dan podcast. Sehingga pembuat konten dan bisnis dapat menjangkau lebih banyak orang di seluruh dunia, dengan lancar dan dengan suara mereka sendiri.

Sebuah platform konten bernama HeyGen, menggunakan Voice Engine untuk penerjemahan video, sehingga mereka dapat menerjemahkan suara pembicara ke berbagai bahasa dan menjangkau pemirsa global.

Saat digunakan untuk penerjemahan, Voice Engine mempertahankan aksen asli penutur asli. Misalnya, menghasilkan bahasa Inggris dengan sampel audio dari penutur bahasa Prancis, akan menghasilkan ucapan dengan aksen Prancis.

  1. Menjangkau Komunitas Global

NGO yang bekerja dengan memberi layanan penting di wilayah terpencil, Dimagi, sedang membangun alat bagi petugas kesehatan masyarakat untuk memberikan berbagai layanan penting, seperti konseling bagi ibu menyusui.

Dimagi menggunakan Voice Engine dan GPT-4, untuk memberikan umpan balik interaktif dalam bahasa utama setiap pekerja; termasuk Swahili atau bahasa informal seperti Sheng, bahasa campuran kode yang populer di Kenya. Tentunya, ini membuat pelayanan lebih mudah menjangkau sasaran.

  1. Membantu Orang-orang dengan Gangguan Kemampuan Bicara

  • Voice Engine membantu orang-orang yang mengalami kekurangan bersifat non-verbal, atau orang yang sedang menjalani terapi karena kondisi mereka yang memengaruhi kemampuan bicara.

Livox, aplikasi komunikasi alternatif AI, mendukung perangkat Augmentative & Alternative Communication (AAC) yang memungkinkan penyandang disabilitas untuk berkomunikasi.

Voice Engine bisa memungkinkan penggunanya memilih ucapan yang paling mewakili dirinya, dan bagi pengguna multibahasa, sekaligus mempertahankan konsistensi suara di setiap bahasa lisan.

  • Membantu pasien memulihkan suaranya, bagi mereka yang menderita kondisi bicara mendadak atau degeneratif.

Norman Prince Neurosciences Institute di Lifespan, sebuah sistem kesehatan nirlaba yang berfungsi sebagai afiliasi pengajaran utama fakultas kedokteran Brown University, sedang menjajaki penggunaan AI dalam konteks klinis.

Mereka telah menguji coba program yang menawarkan kemampuan Voice Engine, kepada individu dengan etiologi onkologis atau neurologis, untuk gangguan bicara.

Baca Juga: Beasiswa Digital Talent Scholarship Kembali Dibuka untuk 2.500 Orang! Begini Cara Daftarnya

Meski memberikan banyak manfaat, OpenAI menyadari bahwa yang harus tetap menjadi perhatian dalam pengembangan Voice Engine adalah risiko serius yang ditimbulkan.

Untuk itu, OpenAI bekerja sama dengan mitra-mitra di Amerika Serikat dan internasional dari berbagai kalangan pemerintahan, media, hiburan, pendidikan, masyarakat sipil, dan lainnya, agar mereka dapat memberikan masukan kebijakan keamanan alat ini.

"Mitra yang menguji Voice Engine, telah menyetujui kebijakan penggunaan kami, yang melarang peniruan identitas individu atau organisasi lain tanpa izin atau hak hukum," kata perusahaan.

"Selain itu, persyaratan kami dengan mitra ini memerlukan persetujuan yang jelas dan terinformasi dari pembicara asli, dan kami tidak mengizinkan pengembang membangun cara bagi pengguna individu untuk menyuarakan pendapat mereka sendiri," lanjut OpenAI lagi.

OpenAI juga memberikan tanda air untuk melacak asal audio apa pun yang dihasilkan oleh Voice Engine, serta pemantauan proaktif terhadap cara penggunaannya.

Baca Juga: Pulang Kampung Naik Mobil Pribadi? Wajib Cek 8 Komponen Ini

Baca Juga: 8 Hal Yang Harus Diterapkan, Ketika Bawa Mobil Menyeberang Laut

Follow Berita Techverse.Asia di Google News
Berita Terkait
Techno

Sam Altman Mulai Spill Tipis-Tipis GPT-5

Rabu 17 Januari 2024, 16:45 WIB
Sam Altman Mulai Spill Tipis-Tipis GPT-5
Berita Terkini
Techno27 April 2025, 20:17 WIB

Intel Dikabarkan akan Lakukan PHK Puluhan Ribu Karyawannya

Sejumlah orang yang tidak disebutkan jumlahnya akan kehilangan pekerjaan karena perusahaan berupaya memangkas manajemen menengah.
Intel. (Sumber: Intel)
Lifestyle27 April 2025, 19:53 WIB

McDonalds Indonesia Hadirkan Paket A Minecraft Movie Meal dan Happy Meal Eksklusif

Bagi konsumen yang membeli paket ini bisa mendapat karakter dalam gim Minecraft.
McDonalds paket A Minecraft Movie Meal. (Sumber: istimewa)
Techno27 April 2025, 18:44 WIB

Motorola Rilis Moto Buds Loop, Earbud Bertabur Kristal Swarovski

Moto Buds Loop dengan kristal Swarovski adalah perpaduan sempurna antara kemewahan dan inovasi.
Motorola Moto Buds Loop. (Sumber: motorola)
Automotive27 April 2025, 16:59 WIB

Digelar di Sam Poo Kong, Ribuan Pengunjung Padati IMX 2025 Semarang

IMX 2025 Semarang terbukti menjadi magnet kuat bagi pecinta otomotif dan lifestyle.
Gofar Hilman (kiri) memperkenalkan Suzuki S-Presso yang sudah ia modifikasi. (Sumber: istimewa)
Techno27 April 2025, 16:35 WIB

Spotify AI Playlist Diluncurkan di 3 Benua Ini dan Karibia

Total ada 40 pasar tambahan yang ini memiliki fitur AI Playlist.
Spotify AI Playlist. (Sumber: spotify)
Startup27 April 2025, 16:12 WIB

McEasy Umumkan Pendanaan dari InnoVen Capital SEA, Transformasi Rantai Pasok

Pendanaan ini diterima setelah McEasy mengumumkan permodalan seri A+.
Startup McEasy.
Techno27 April 2025, 15:38 WIB

Bitcoin Tembus US$93.000 dan Saham AS Menghijau Imbas Optimisme Perdagangan AS-China

Namun risiko masih membayangi atas kenaikan ini.
Ilustrasi Bitcoin.
Techno25 April 2025, 20:09 WIB

Audio-Techinca Hotaru: Pemutar Piringan Hitam Senilai Ratusan Juta yang Bisa Melayang dan Bersinar

Turntable ini hanya akan diproduksi sebanyak seribu unit.
Turntable Audio-Technica Hotaru bersinar dalam beberapa mode dan palet warna yang berbeda. (Sumber: Audio-Technica)
Techno25 April 2025, 19:41 WIB

Motorola Luncurkan Smartwatch Pertamanya: Moto Watch Fit

Daya tahan baterai selama 16 hari kedengarannya mengesankan.
Motorola Moto Watch Fit. (Sumber: Motorola)
Techno25 April 2025, 19:16 WIB

Rayban x Meta Hadirkan Fitur-fitur Anyar, Terjemahan Langsung dan AI

Konsumen juga dapat memesannya dalam beberapa pilihan warna baru.
Kacamata pintar Rayban Meta.