Alibaba Hadirkan Qwen3, Serangkaian Model Penalaran Kecerdasan Buatan 'Hibrida'

Rahmat Jiwandono
Kamis 01 Mei 2025, 18:53 WIB
Alibaba Qwen3. (Sumber: Alibaba)

Alibaba Qwen3. (Sumber: Alibaba)

Techverse.asia - Perusahaan teknologi asal China, Alibaba pada minggu ini telah resmi merilis Qwen3, serangkaian model kecerdasan buatan (AI) yang diklaim dapat menyamai dan, dalam beberapa kasus, mengungguli model terbaik yang tersedia dari Google dan OpenAI.

Baca Juga: Lagi, Alibaba Kucurkan Dana Besar untuk Lazada

Sebagian besar model tersebut - atau akan segera - tersedia untuk diunduh di bawah lisensi 'terbuka' pada platform pengembangan AI Hugging Face dan GitHub. Ukurannya sendiri berkisar dari 0,6 miliar parameter hingga 235 miliar parameter.

Sebagai informasi, parameter secara kasar sesuai dengan keterampilan pemecahan masalah suatu model, dan model dengan lebih banyak parameter umumnya berkinerja lebih baik daripada model dengan lebih sedikit parameter.

Meningkatnya seri model yang berasal dari Negeri Tirai Bambu seperti Qwen telah meningkatkan tekanan pada laboratorium Amerika Serikat (AS) seperti OpenAI untuk menghadirkan teknologi kecerdasan buatan yang lebih mumpuni.

Baca Juga: Amazon Terbangkan 27 Satelit Internet Project Kuiper, Menyaingi Starlink?

Mereka juga telah mendorong para pembuat kebijakan untuk menerapkan pembatasan yang bertujuan membatasi kemampuan perusahaan AI China untuk memperoleh chipset yang diperlukan untuk melatih model.

Menurut Alibaba, model Qwen3 adalah model 'hibrida' - mereka dapat membutuhkan waktu untuk 'bernalar' melalui masalah yang rumit, atau menjawab permintaan yang lebih sederhana dengan cepat.

Penalaran memungkinkan model untuk memeriksa fakta sendiri secara efektif, mirip dengan model seperti OpenAI o3, tetapi dengan biaya latensi yang lebih tinggi.

“Kami telah mengintegrasikan mode berpikir dan non-berpikir dengan mulus, yang menawarkan fleksibilitas kepada pengguna untuk mengendalikan anggaran berpikir. Desain ini memungkinkan pengguna untuk mengonfigurasi anggaran khusus tugas dengan lebih mudah,” tulis tim Qwen dalam sebuah posting blog kami kutip, Kamis (1/5/2025).

Baca Juga: OpenAI Meluncurkan o3-mini, Lebih 'Pintar' Ketimbang o1-Mini

Beberapa model juga mengadopsi arsitektur campuran pakar (MoE), yang dapat lebih efisien secara komputasi untuk menjawab pertanyaan. MoE memecah tugas menjadi subtugas dan mendelegasikannya ke model 'pakar/' yang lebih kecil dan terspesialisasi.

Model Qwen3 diklaim mendukung 119 bahasa, kata Alibaba, dan dilatih pada kumpulan data lebih dari 36 triliun token. Token adalah bit data mentah yang diproses oleh model; untuk satu juta token setara dengan sekitar 750 ribu kata.

Alibaba mengatakan bahwa Qwen3 dilatih pada kombinasi buku teks, pasangan pertanyaan-jawaban, potongan kode, data yang dihasilkan oleh kecerdasan buatan, dan masih banyak lagi.

Peningkatan tersebut, bersama dengan yang lainnya, sangat meningkatkan kemampuan Qwen3 dibandingkan dengan pendahulunya yaitu Qwen2. Tak satu pun model Qwen3 yang tampak lebih unggul dibandingkan model-model terkini seperti o3 dan o4-mini milik OpenAI, tetapi keduanya tetap memiliki performa yang kuat.

Baca Juga: Meta Meluncurkan Aplikasi AI Mandiri, Siap Bersaing dengan Chatbot Lainnya

Di Codeforces, sebuah platform untuk kontes pemrograman, model Qwen3 terbesar - ​​Qwen-3-235B-A22B - mengalahkan o3-mini milik OpenAI dan Gemini 2.5 Pro milik Google.

Qwen-3-235B-A22B juga mengalahkan o3-mini pada versi terbaru AIME, sebuah tolok ukur matematika yang menantang, dan BFCL, sebuah tes untuk menilai kemampuan model dalam 'bernalar' tentang masalah.

Model Qwen3 publik terbesar, Qwen3-32B, masih kompetitif dengan sejumlah model AI milik sendiri dan terbuka, termasuk R1 milik lab AI China lainnya yaitu DeepSeek. Qwen3-32B melampaui model o1 milik OpenAI pada beberapa tes, termasuk tolok ukur pengkodean LiveCodeBench.

Alibaba menyatakan bahwa Qwen3 'unggul' dalam kemampuan memanggil alat serta mengikuti instruksi dan menyalin format data tertentu. Selain model untuk diunduh, Qwen3 tersedia dari penyedia komputasi awan atau cloud, termasuk Fireworks AI dan Hyperbolic.

Baca Juga: Generator Gambar ChatGPT Sekarang Tersedia untuk Semua Pengguna Gratis

Follow Berita Techverse.Asia di Google News
Berita Terkait Berita Terkini
Lifestyle14 Mei 2025, 15:58 WIB

Mission Impossible: The Final Reckoning Diputar untuk Pewarta, Dapat Tanggapan Positif

Film franchise kedelapan ini akan tayang global pada 23 Mei 2025.
Salah satu adegan dalam film Mission Impossible - The Final Reckoning. (Sumber: Skydance)
Automotive14 Mei 2025, 14:38 WIB

Harley Davidson x MotoGP akan Gelar Seri Balap Global pada 2026

Seri kejuaraan Harley Davidson baru akan digelar di enam akhir pekan MotoGP.
Harley-Davidson x MotoGP mengumumkan seri balap global baru yang diluncurkan tahun depan. (Sumber: MotoGP)
Startup14 Mei 2025, 14:21 WIB

Ikan Tuna Hasil Tangkapan Nelayan Binaan Aruna Diekspor ke Luar Negeri

Ikan tuna yang ditangkap telah dibekukan dan dikirim ke Uni Emirat Arab.
Ikan hasil tangkapan nelayan binaan Aruna diekspor ke luar negeri. (Sumber: istimewa)
Techno14 Mei 2025, 13:47 WIB

Instax Mini 41 Diniagakan di Indonesia Senilai Rp1,7 Juta, Ada 2 Fitur Baru

Instax Mini 41 dibuat untuk pembuat gambar yang peduli dengan bentuk dan fungsi.
Instax Mini 41. (Sumber: Fujifilm)
Techno14 Mei 2025, 13:11 WIB

Harga dan Spek Sony Xperia 1 VII, Dirakit dengan Hardware Walkman dan Bravia

Sony mengambil teknologi dari TV, kamera, dan Walkman untuk meningkatkan ponsel andalannya.
Sony Xperia 1 VII. (Sumber: Sony)
Lifestyle13 Mei 2025, 20:00 WIB

Toys R Us Asia Hadirkan Live Toyful: Semangat Bermain untuk Semua Kalangan Usia

Lewat Live Toyful, Toys R Us Asia siap memasuki babak baru retailtainment.
Toys 'R' Us. (Sumber: istimewa)
Techno13 Mei 2025, 19:24 WIB

WWDC 2025: iOS 19 akan Menyertakan Fitur Manajemen Baterai AI dan Sinkronisasi Lintas Perangkat

WWDC 2025 sendiri akan dilaksanakan pada 9-13 Juni 2025.
Ilustrasi iOS 19. (Sumber: 9to5Mac)
Automotive13 Mei 2025, 18:42 WIB

Cara Cek Keaslian AHM Oil dengan Aplikasi Motorku X

Untuk menghindari pemalsuan oli AHM, pelanggan bisa memindainya lewat aplikasi Motorku X.
Ilustrasi cek keaslian oli AHM. (Sumber: istimewa)
Techno13 Mei 2025, 18:28 WIB

VSCO Hadirkan Fitur AI Bernama Canvas, Bikin Gambar dari Perintah Teks

Fitur ini memungkinkan pengguna untuk mengimpor dan menyunting foto menggunakan alat penyuntingan VSCO standar.
VSCO.
Startup13 Mei 2025, 18:09 WIB

LuarKampus: Startup Pencari Beasiswa dari Pontianak Jadi Pemenang NextDev ke-10

Telkomsel Dorong Inovasi Digital dengan AI bersama 10 Startup Finalis.
3 startup pemenang program NextDev Summit ke-10. (Sumber: telkomsel)