Alibaba Hadirkan Qwen3, Serangkaian Model Penalaran Kecerdasan Buatan 'Hibrida'

Techverse.asia - Perusahaan teknologi asal China, Alibaba pada minggu ini telah resmi merilis Qwen3, serangkaian model kecerdasan buatan (AI) yang diklaim dapat menyamai dan, dalam beberapa kasus, mengungguli model terbaik yang tersedia dari Google dan OpenAI.

Sebagian besar model tersebut - atau akan segera - tersedia untuk diunduh di bawah lisensi 'terbuka' pada platform pengembangan AI Hugging Face dan GitHub. Ukurannya sendiri berkisar dari 0,6 miliar parameter hingga 235 miliar parameter.

Sebagai informasi, parameter secara kasar sesuai dengan keterampilan pemecahan masalah suatu model, dan model dengan lebih banyak parameter umumnya berkinerja lebih baik daripada model dengan lebih sedikit parameter.

Meningkatnya seri model yang berasal dari Negeri Tirai Bambu seperti Qwen telah meningkatkan tekanan pada laboratorium Amerika Serikat (AS) seperti OpenAI untuk menghadirkan teknologi kecerdasan buatan yang lebih mumpuni.

Mereka juga telah mendorong para pembuat kebijakan untuk menerapkan pembatasan yang bertujuan membatasi kemampuan perusahaan AI China untuk memperoleh chipset yang diperlukan untuk melatih model.

Menurut Alibaba, model Qwen3 adalah model 'hibrida' - mereka dapat membutuhkan waktu untuk 'bernalar' melalui masalah yang rumit, atau menjawab permintaan yang lebih sederhana dengan cepat.

Penalaran memungkinkan model untuk memeriksa fakta sendiri secara efektif, mirip dengan model seperti OpenAI o3, tetapi dengan biaya latensi yang lebih tinggi.

“Kami telah mengintegrasikan mode berpikir dan non-berpikir dengan mulus, yang menawarkan fleksibilitas kepada pengguna untuk mengendalikan anggaran berpikir. Desain ini memungkinkan pengguna untuk mengonfigurasi anggaran khusus tugas dengan lebih mudah,” tulis tim Qwen dalam sebuah posting blog kami kutip, Kamis (1/5/2025).

Beberapa model juga mengadopsi arsitektur campuran pakar (MoE), yang dapat lebih efisien secara komputasi untuk menjawab pertanyaan. MoE memecah tugas menjadi subtugas dan mendelegasikannya ke model 'pakar/' yang lebih kecil dan terspesialisasi.

Model Qwen3 diklaim mendukung 119 bahasa, kata Alibaba, dan dilatih pada kumpulan data lebih dari 36 triliun token. Token adalah bit data mentah yang diproses oleh model; untuk satu juta token setara dengan sekitar 750 ribu kata.

Alibaba mengatakan bahwa Qwen3 dilatih pada kombinasi buku teks, pasangan pertanyaan-jawaban, potongan kode, data yang dihasilkan oleh kecerdasan buatan, dan masih banyak lagi.

Peningkatan tersebut, bersama dengan yang lainnya, sangat meningkatkan kemampuan Qwen3 dibandingkan dengan pendahulunya yaitu Qwen2. Tak satu pun model Qwen3 yang tampak lebih unggul dibandingkan model-model terkini seperti o3 dan o4-mini milik OpenAI, tetapi keduanya tetap memiliki performa yang kuat.

Di Codeforces, sebuah platform untuk kontes pemrograman, model Qwen3 terbesar - Qwen-3-235B-A22B - mengalahkan o3-mini milik OpenAI dan Gemini 2.5 Pro milik Google.

Qwen-3-235B-A22B juga mengalahkan o3-mini pada versi terbaru AIME, sebuah tolok ukur matematika yang menantang, dan BFCL, sebuah tes untuk menilai kemampuan model dalam 'bernalar' tentang masalah.

Model Qwen3 publik terbesar, Qwen3-32B, masih kompetitif dengan sejumlah model AI milik sendiri dan terbuka, termasuk R1 milik lab AI China lainnya yaitu DeepSeek. Qwen3-32B melampaui model o1 milik OpenAI pada beberapa tes, termasuk tolok ukur pengkodean LiveCodeBench.

Alibaba menyatakan bahwa Qwen3 'unggul' dalam kemampuan memanggil alat serta mengikuti instruksi dan menyalin format data tertentu. Selain model untuk diunduh, Qwen3 tersedia dari penyedia komputasi awan atau cloud, termasuk Fireworks AI dan Hyperbolic.