Tak Puas Hanya dengan Massively Multilingual Speech, Meta Merilis SeamlessM4T

Uli Febriarni
Kamis 24 Agustus 2023, 15:36 WIB
SeamlessM4T (Sumber : meta)

SeamlessM4T (Sumber : meta)

Awal tahun ini, Meta telah meluncurkan Massively Multilingual Speech. MMS ini menyediakan teknologi pengenalan ucapan, identifikasi bahasa, dan sintesis ucapan di lebih dari 1.100 bahasa.

Dan terbaru, Meta merilis model speech-to-text (lisan ke tulisan) baru yang dapat menerjemahkan hampir 100 bahasa, disebut SeamlessM4T.

SeamlessM4T, singkatan dari Massively Multilingual and Multimodal Machine Translation. Menurut perusahaan, ini dapat menerjemahkan speech-to-text dan text-to-text untuk hampir 100 bahasa. Untuk tindakan speech-to-speech dan text-to-speech (tulisan ke lisan), ia mengenali 100 bahasa masukan dan mengubahnya menjadi 35 bahasa keluaran.

"Ini dirilis di bawah lisensi Creative Commons CC BY-NC 4.0," tulis Meta di keterangan resmi mereka, dilansir Kamis (24/8/2023).

Baca Juga: Bard Tersedia Dalam 40 Bahasa, Termasuk Bahasa Indonesia

Baca Juga: Contek Live Selling Ala Selebritis, Cuannya Gak Tipis

Riset ini menantang bagi para ilmuwan di Meta, karena sistem speech-to-speech dan speech-to-text yang ada hanya mencakup sebagian kecil dari bahasa dunia.

Tidak seperti model terjemahan sebelumnya lainnya, SeamlessM4T menggunakan satu sistem tunggal. Ini yang kemudian membuat Meta percaya, pendekatan yang diterapkan SeamlessM4T bakal mengurangi kesalahan dan penundaan, meningkatkan efisiensi dan kualitas proses penerjemahan.

Meta mendeskripsikan sistem terjemahan barunya sebagai 'model terjemahan AI multimodal dan multibahasa lengkap pertama', yang mampu mengenali ucapan dan terjemahan ucapan ke teks untuk hampir 100 bahasa berbeda.

Model ini juga dapat menginterpretasikan ucapan dan teks, dan mengeluarkan kata-kata lisan yang diterjemahkan masing-masing untuk 36 dan 35 bahasa.

M4T bahkan dilaporkan dapat memahami ketika pengguna mengubah bahasa di tengah kalimat. Dia dapat membantu, ketika menggunakan model untuk menerjemahkan orang-orang yang mencampurkan beberapa bagian bahasa saat mereka berbicara, yang oleh para peneliti bahasa disebut sebagai alih kode.

Sepertinya ini sangat membantu bagi wisatawan asing, bila bertemu anak muda Jakarta Selatan yang sering bilingual ya?

Meta menambahkan, SeamlessM4T dibangun berdasarkan kemajuan yang telah dibuat selama bertahun-tahun dalam upaya menciptakan penerjemah universal.

Manajer Ilmuwan Riset Meta, Paco Guzmán, dalam video demo di laman Meta, ia mengucapkan kalimat "tujuan kami adalah menciptakan dunia yang lebih terhubung."

Baca Juga: Cuma Maraton Drakor Bisa Dibayarin Wisata ke Korea 5 Hari 3 Malam, Begini Caranya

Baca Juga: Lenovo Cegah Kepunahan Bahasa Asli Suku Māori, Lewat Peluncuran Keyboard Bilingual

Sementara pihak Meta menilai, kehadiran SeamlessM4T hanyalah langkah terbaru dalam upaya berkelanjutan mereka, untuk membangun teknologi bertenaga AI yang membantu menghubungkan orang-orang lintas bahasa.

"Di masa depan, kami ingin mengeksplorasi bagaimana model dasar ini dapat memungkinkan kemampuan komunikasi baru, yang pada akhirnya membawa kita lebih dekat ke dunia di mana semua orang dapat dipahami," ungkap perusahaan.

Bersamaan dengan SeamlessM4T, Meta juga merilis metadata untuk kumpulan data terjemahan terbukanya, SeamlessAlign.

Sebelum SeamlessM4T, Massively Multilingual Speech (MMS) yang juga bertenaga kecerdasan buatan atau Artificial Intelligence (AI) dapat mengenali lebih dari 4.000 bahasa lisan dan menghasilkan ucapan (text-to-speech) lebih dari 1.100.

Pengenalan ucapan dan model text-to-speech, biasanya memerlukan pelatihan selama ribuan jam audio, dengan label transkripsi yang menyertainya. Label sangat penting untuk pembelajaran mesin, memungkinkan algoritme mengkategorikan dan memahami data dengan benar.

Namun untuk bahasa yang tidak banyak digunakan di negara industri, banyak di antaranya terancam punah dalam beberapa dekade mendatang.

Baca Juga: 6 Bukti Negara-negara Asia Lebih Update Teknologi Ketimbang Barat

Baca Juga: Spek Lengkap Tablet Entry Level Huawei MatePad 11.5 yang Dirilis di Indonesia

Meta menggunakan pendekatan yang tidak konvensional, untuk mengumpulkan data audio, yakni dengan memanfaatkan rekaman audio dari teks-teks agama yang diterjemahkan.

CEO Meta, Mark Zuckerberg, menjelaskan, setelah melatih model penyelarasan untuk membuat data lebih bermanfaat, Meta menggunakan wav2vec 2.0, model pembelajaran representasi ucapan mandiri buatan perusahaan, yang dapat melatih data tanpa label. Menggabungkan sumber data yang tidak konvensional dan model ucapan yang diawasi sendiri.

"Hasil kami menunjukkan bahwa model Massively Multilingual Speech bekerja dengan baik, dibandingkan dengan model yang ada dan mencakup 10 kali lebih banyak bahasa," kata dia.

Follow Berita Techverse.Asia di Google News
Berita Terkait Berita Terkini
Startup10 Mei 2024, 16:40 WIB

Amartha Komitmen Bangun Ekosistem Finansial Inklusif di Asia Tenggara

Amartha menilai, Indonesia saat ini menjadi tempat tujuan impact investing. Memungkinkan para investor dan institusi global mendiversifikasi portofolio mereka di pasar & memberikan dampak sosial bagi masyarakat.
Amartha komitmen Bangun Ekosistem Finansial Inklusif di Asia Tenggara (Sumber: Amartha)
Startup10 Mei 2024, 15:37 WIB

Rugi dan Terjerat Gagal Bayar, Izin Usaha TaniFund Dicabut OJK

Tingkat kredit macet dan kerugian bisnis yang dialami perusahaan terus bertambah waktu ke waktu.
Data kegiatan usaha TaniFund (Sumber: TaniFund)
Startup10 Mei 2024, 15:13 WIB

Elevarm Akan Tingkatkan Kapasitas Produksi Bibit dan Pupuk Organik Hingga 3x Lipat

Langkah itu mereka lakukan, usai mendapatkan pendanaan awal dari sejumlah investor, dengan nilai mencapai US$2,6 juta (sekitar Rp41,6 miliar)
(ilustrasi) Elevarm raih pendanaan awal senilai 2,6 Juta USD untuk pemberdayaan petani hortikultura (Sumber: Elevarm)
Techno10 Mei 2024, 15:09 WIB

Spek Lengkap Vivo V30e: Pakai Prosesor Snapdragon 6 Gen 1

Lebih awet dengan Performa Terbaik dan Durabilitas Terjamin.
Vivo V30e resmi dipasarkan di Indonesia mulai Mei 2024. (Sumber: Vivo)
Techno10 Mei 2024, 14:44 WIB

Bluesky Dianggap Jadi Mirip Twitter, Jack Dorsey Keluar dari Dewan Bluesky

Jack Dorsey menilai bahwa Bluesky melakukan kesalahan-kesalahan yang dulu ia lakukan saat masih mengembangkan Twitter (sekarang X)
Jack Dorsey keluar dari dewan Bluesky (Sumber: Getty Images via Business Insider)
Techno10 Mei 2024, 14:42 WIB

Alat AI Meta untuk Pengiklan Kini Bisa Membuat Gambar Baru Sepenuhnya

Jadi bukan hanya latar belakang baru saja yang mampu diciptakan oleh Meta AI.
Meta AI untuk pengiklan kini bisa membuat gambar baru sepenuhnya. (Sumber: Meta)
Techno10 Mei 2024, 14:29 WIB

Yellow.ai Lansir Orchestrator LLM: Kemampuan Percakapan Pelanggan yang Kontekstual

Teknologi ini memahami maksud pelanggan dan menggerakkan alat yang sesuai tanpa pelatihan manual.
Yellow.ai meluncurkan Orchestrator LLM. (Sumber: istimewa)
Techno10 Mei 2024, 14:22 WIB

Tiga Perusahaan Besar Indonesia Transformasikan Bisnisnya dengan Memanfaatkan AI

Telkom, BUMA dan DANA mengoptimalkan penggunaan Microsoft 365 Copilot dalam kegiatan usaha
BUMA, DANA, dan TELKOM mentransformasi bisnis mereka dengan AI bersama Microsoft (Sumber: Microsoft)
Techno10 Mei 2024, 14:06 WIB

Iklan iPad Pro Menuai Kecaman: Dianggap Metafora 'AI Generatif Menghancurkan Ciptaan Manusia'

Iklan bertema 'Crush' itu dianggap memberikan kiasan bahwa Apple membunuh kreativitas manusia, dengan menunjukkan hadirnya produk iPad Pro
Apple minta maaf karena iklan yang bertema 'Crush' dinilai tone deaf (Sumber: Apple via twitter Tim Cook)
Techno10 Mei 2024, 13:58 WIB

Reku Paparkan Optimisme dan Prospek Kripto Jangka Panjang, Ada Potensi Rebound

Bitcoin terus ditambang di tengah tingginya biaya produksi mengindikasikan bullish.
Reku.