Meta Luncurkan Massively Multilingual Speech, Bisa Mengenal Ribuan Bahasa Lisan

Rahmat Jiwandono
Rabu 31 Mei 2023, 14:31 WIB
Ilustrasi kantor Meta. (Sumber : istockphoto)

Ilustrasi kantor Meta. (Sumber : istockphoto)

Techverse.asia – Meta telah membuat model bahasa kecerdasan buatan atau Artificial Intelligence (AI) yang bukan merupakan tiruan ChatGPT. Proyek bertenaga AI tersebut adalah Massively Multilingual Speech (MMS) yang dapat mengenali lebih dari 4.000 bahasa lisan dan menghasilkan ucapan (text-to-speech) di lebih dari 1.100.

Seperti kebanyakan proyek AI lainnya yang diumumkan secara publik, Meta mengumumkan bahwa MMS adalah sumber terbuka saat ini untuk membantu melestarikan keragaman bahasa dan mendorong para peneliti untuk membangun fondasinya.

“Hari ini, kami membagikan model dan kode kami secara publik sehingga orang lain dalam komunitas riset dapat mengembangkan pekerjaan kami. Melalui karya ini, kami berharap dapat memberikan kontribusi kecil untuk melestarikan keanekaragaman bahasa yang luar biasa di dunia,” tulis Meta dikutip Techverse.asia pada Rabu (31/5/2023). 

Pengenalan ucapan dan model text-to-speech biasanya memerlukan pelatihan selama ribuan jam audio dengan label transkripsi yang menyertainya. Label sangat penting untuk pembelajaran mesin, memungkinkan algoritme mengkategorikan dan "memahami" data dengan benar.

Namun untuk bahasa yang tidak banyak digunakan di negara industri — banyak di antaranya terancam punah dalam beberapa dekade mendatang — “ini data tidak ada,” seperti yang dikatakan Meta.

Baca Juga: Motorola Edge 40 Business Edition: Ponsel dengan Fitur Keamanan ThinkShield

Meta menggunakan pendekatan yang tidak konvensional untuk mengumpulkan data audio yakni dengan memanfaatkan rekaman audio dari teks-teks agama yang diterjemahkan. “Kami beralih ke teks-teks agama, seperti Alkitab, yang telah diterjemahkan dalam berbagai bahasa dan terjemahannya telah dipelajari secara luas untuk penelitian terjemahan bahasa berbasis teks,” kata perusahaan milik Mark Zuckerberg itu.

Terjemahan tersebut memiliki rekaman audio yang tersedia untuk umum dari orang yang membaca teks ini dalam berbagai bahasa. Menggabungkan rekaman Alkitab yang tidak berlabel dan teks serupa, peneliti Meta meningkatkan bahasa model yang tersedia menjadi lebih dari 4.000.

Pendekatan itu mungkin membuat orang-orang terheran saat pertama kali mendengar atau membacanya, karena kedengarannya seperti resep untuk model AI yang sangat bias terhadap pandangan dunia Kristen. Namun, Meta mengatakan bukan itu masalahnya.

“Meskipun isi rekaman audionya religius, analisis kami menunjukkan bahwa model ini tidak bias menghasilkan bahasa yang lebih religius. Kami percaya ini karena kami menggunakan pendekatan klasifikasi temporal koneksionis (CTC), yang jauh lebih terbatas dibandingkan dengan model bahasa besar (LLM) atau model urutan-ke-urutan untuk pengenalan suara,” tulis Meta

Selain itu, meskipun sebagian besar rekaman religius dibacakan oleh penutur laki-laki, hal itu juga tidak menimbulkan bias laki-laki, justru malah tampil sama baiknya dalam suara perempuan dan laki-laki.

Setelah melatih model penyelarasan untuk membuat data lebih bermanfaat, Meta menggunakan wav2vec 2.0, model pembelajaran representasi ucapan mandiri buatan perusahaan, yang dapat melatih data tanpa label. Menggabungkan sumber data yang tidak konvensional dan model ucapan yang diawasi sendiri menghasilkan hasil yang mengesankan.

“Hasil kami menunjukkan bahwa model Massively Multilingual Speech bekerja dengan baik dibandingkan dengan model yang ada dan mencakup 10 kali lebih banyak bahasa,” terangnya.

Baca Juga: Google Product Studio: Bisa Edit Gambar Produk Menggunakan Kecerdasan Buatan

Secara khusus, Meta membandingkan MMS dengan Whisper OpenAI, dan itu melebihi ekspektasi mereka. “Kami menemukan bahwa model yang dilatih pada data Massively Multilingual Speech mencapai separuh tingkat kesalahan kata, tetapi Massively Multilingual Speech mencakup 11 kali lebih banyak bahasa,” paparnya. 

Meta memperingatkan bahwa model barunya tidak sempurna. Misalnya, ada beberapa risiko bahwa model ucapan ke teks dapat salah menerjemahkan kata atau frasa tertentu tulis perusahaan itu.

“Tergantung pada keluarannya, ini dapat mengakibatkan bahasa yang menyinggung dan/atau tidak akurat. Kami terus percaya bahwa kolaborasi lintas komunitas AI sangat penting untuk pengembangan teknologi AI yang bertanggung jawab,” katanya. 

Sekarang Meta telah merilis MMS untuk penelitian sumber terbuka, ia berharap dapat membalikkan tren teknologi yang menyusutkan bahasa dunia menjadi 100 atau kurang yang paling sering didukung oleh Big Tech. Ia melihat dunia di mana teknologi asistif, TTS, dan bahkan teknologi VR / AR memungkinkan semua orang berbicara dan belajar dalam bahasa ibu mereka.

Dikatakan, Meta membayangkan dunia di mana teknologi memiliki efek sebaliknya, mendorong orang untuk menjaga bahasa mereka tetap hidup karena mereka dapat mengakses informasi dan menggunakan teknologi dengan berbicara dalam bahasa pilihan mereka.

Follow Berita Techverse.Asia di Google News
Berita Terkait Berita Terkini
Techno22 Juni 2024, 15:01 WIB

Hyundai Debutkan Robot Parkir, KIA Kenalkan Robot Pengisi Daya Baterai EV

Robot-robot yang dikembangkan oleh Hyundai dan KIA itu telah ditanamkan kecerdasan buatan (AI)
Robot parkir Hyundai sedang bekerja (Sumber: Hyundai)
Techno22 Juni 2024, 10:33 WIB

Pakai Toughbook 40 Mk2 dari Panasonic, Tak Perlu Was-was di Tengah Mobilitas Tinggi dan Cadasnya Lapangan

Toughbook 40 Mk2 meningkatkan efisiensi dan memberikan kinerja unggul bagi pekerja critical, teknik, serta lapangan.
Toughbook 40 Mk 2 (Sumber: Pamasonic)
Travel22 Juni 2024, 08:07 WIB

Bosan Lari di Stadion dan Jalan Raya? Lari ke Pantai!

Masih ingat puisi yang dibacakan oleh Cinta di film Ada Apa dengan Cinta 1 kah? Salah satu baitnya berbunyi "Kulari ke pantai"
Suasana sore di tepian Pantai Dewa Ruci, Purworejo, Jawa Tengah (Sumber: Techverse.Asia | Foto: Uli Febriarni)
Techno22 Juni 2024, 06:37 WIB

Galaxy Watch FE di Indonesia Tersedia dalam Dua Warna, Segini Harganya

Galaxy Watch FE sudah bisa dibeli oleh konsumen Indonesia pada 24 Juni 2024, smartwatch ini tersedia dalam dua warna: hitam dan pink gold.
Samsung Galaxy Watch FE (Sumber: Samsung)
Startup21 Juni 2024, 17:15 WIB

Berawal dari Sama-Sama Suka Ayam Geprek, Begini Cerita Tiga Sekawan Bangun Chickin

Chickin adalah startup agritech yang dibangun yang bukan hanya bantu peternak mengelola ayam-ayam, tetapi juga hasil olahannya.
Produk olahan yang dihasilkan Chickin bersama mitra mereka (Sumber: Chickin)
Techno21 Juni 2024, 16:01 WIB

1 Dekade Berlalu dari Rilis WIDE 300, Fujifilm hadirkan Instax WIDE 400

Ukuran cetakan dan gambar format lebar Instax Wide 400 berukuran dua kali lipat dari film Mini instax, serta kualitas lebih baik ketimbang WIDE 300
Instax WIDE 400 (Sumber: Fujifilm)
Techno21 Juni 2024, 15:23 WIB

Instagram Meluncurkan Siaran Langsung ke Daftar Close Friends

Pengguna akan dapat melakukan streaming ke sekelompok orang tertentu, bukan ke semua follower mereka.
Pengguna Instagram kini bisa livestream dengan daftar Close Friends mereka. (Sumber: Instagram)
Startup21 Juni 2024, 14:57 WIB

Telkomsel, Tencent dan MCash, Terapkan Teknologi Pindai Telapak Tangan untuk Identifikasi Pelanggan

Teknologi palm scanner lebih nyaman, karena proses pindai tidak terpengaruh oleh tinggi badan, kemiripan wajah pada kembar, dan suasana ramai.
(ilustrasi) palm scanner (pemindaian telapak tangan) (Sumber: freepik)
Automotive21 Juni 2024, 14:50 WIB

Astra Honda Motor Rayakan Ulang Tahun ke-54, Banyak Promo

HUT ke-54 Astra Motor Manjakan Konsumen dengan Promo Menarik
Ilustrasi Astra Honda Motor. (Sumber: Astra Honda Motor)
Techno21 Juni 2024, 14:39 WIB

Bitcoin Lesu, Faktor Penting untuk Membuka Prospek Rebound

terdapat sejumlah faktor yang dapat mendorong potensi rebound.
Ilustrasi Bitcoin.