QwQ-32B-Preview: Penantang 'Terbuka' untuk Model Penalaran o1 OpenAI

Rahmat Jiwandono
Selasa 03 Desember 2024, 15:39 WIB
kantor Alibaba (Sumber: Reuters)

kantor Alibaba (Sumber: Reuters)

Techverse.asia - Model kecerdasan buatan atau Artificial Intelligence baru yang disebut "penalaran", QwQ-32B-Preview, telah hadir. Model ini merupakan salah satu dari sedikit model yang menyaingi o1 milik OpenAI, dan merupakan model pertama yang tersedia untuk diunduh dengan lisensi permisif.

Dikembangkan oleh tim Qwen Alibaba, QwQ-32B-Preview berisi 32,5 miliar parameter dan dapat mempertimbangkan perintah hingga lebih 32 ribu kata; model ini berkinerja lebih baik pada tolok ukur tertentu daripada o1-preview dan o1-mini, dua model penalaran yang telah dirilis OpenAI sejauh ini.

Baca Juga: Reku Dapat Lisensi PFAK dari Bappebti, Siap Genjot Pertumbuhan Industri Kripto Indonesia

Parameter secara kasar sesuai dengan keterampilan pemecahan masalah suatu model, dan model dengan lebih banyak parameter umumnya berkinerja lebih baik daripada model dengan lebih sedikit parameter. OpenAI tidak mengungkapkan jumlah parameter untuk modelnya.

Berdasarkan pengujian Alibaba, QwQ-32B-Preview mengalahkan model o1-preview OpenAI pada pengujian AIME dan MATH. AIME menggunakan model AI lain untuk mengevaluasi kinerja model, sementara MATH adalah kumpulan soal cerita.

QwQ-32B-Preview dapat memecahkan teka-teki logika dan menjawab pertanyaan matematika yang cukup menantang, berkat kemampuan "bernalar"-nya. Namun demikian, model ini tidak sempurna.

Alibaba mencatat dalam sebuah posting blog bahwa model tersebut mungkin tiba-tiba beralih bahasa, terjebak dalam loop, dan berkinerja buruk pada tugas yang memerlukan "penalaran akal sehat".

Baca Juga: Bidik Pasar Asia, Louis Vuitton Gandeng Alibaba

Tidak seperti kebanyakan AI, QwQ-32B-Preview dan model penalaran lainnya secara efektif memeriksa fakta sendiri. Hal ini membantu mereka menghindari beberapa jebakan yang biasanya membuat model tersandung, dengan sisi negatifnya adalah mereka sering kali membutuhkan waktu lebih lama untuk sampai pada solusi.

Mirip dengan o1, QwQ-32B-Preview bernalar melalui tugas, merencanakan ke depan, dan melakukan serangkaian tindakan yang membantu model tersebut menemukan jawaban.

QwQ-32B-Preview, yang dapat dijalankan dan diunduh dari platform pengembangan AI Hugging Face, tampaknya mirip dengan model penalaran DeepSeek yang baru-baru ini dirilis karena model ini secara hati-hati membahas topik politik tertentu.

Alibaba dan DeepSeek, sebagai perusahaan China, tunduk pada pembandingan oleh regulator internet di Negeri Tirai Bambu untuk memastikan respons model mereka "mewujudkan nilai-nilai inti sosialis."

Baca Juga: OpenAI Menghadirkan ChatGPT Advanced Voice Mode ke Web

Banyak sistem AI China menolak untuk menanggapi topik yang dapat menimbulkan kemarahan regulator, seperti spekulasi tentang rezim Xi Jinping.

Ketika ditanya "Apakah Taiwan bagian dari China?", QwQ-32B-Preview menjawab bahwa Taiwan bagian dari China - sebuah perspektif yang tidak sejalan dengan sebagian besar dunia tetapi sejalan dengan partai penguasa China. Sementara itu, pertanyaan tentang Lapangan Tiananmen tidak ditanggapi.

QwQ-32B-Preview tersedia "secara terbuka" di bawah lisensi Apache 2.0, yang berarti dapat digunakan untuk aplikasi komersial. Tapi, hanya beberapa komponen model yang telah dirilis, sehingga mustahil untuk mereplikasi QwQ-32B-Preview atau mendapatkan banyak wawasan tentang cara kerja internal sistem.

"Keterbukaan" model AI bukanlah pertanyaan yang pasti, tetapi ada kontinum umum dari yang lebih tertutup (hanya akses API) hingga yang lebih terbuka (model, bobot, data yang diungkapkan) dan yang ini berada di tengah-tengah.

Baca Juga: Chatbot Claude Anthropic Kini Bisa Melakukan Pengodean, Termasuk Java Script

Meningkatnya perhatian pada model penalaran muncul karena kelayakan "hukum penskalaan," teori lama yang menyatakan bahwa memberikan lebih banyak data dan daya komputasi pada suatu model akan terus meningkatkan kemampuannya, mulai diteliti.

Serangkaian laporan pers menunjukkan bahwa model dari lab AI utama termasuk OpenAI, Google, dan Anthropic tidak membaik secara dramatis seperti sebelumnya.

Hal itu telah menyebabkan perebutan pendekatan, arsitektur, dan teknik pengembangan AI baru, salah satunya adalah komputasi waktu pengujian. Dikenal juga sebagai komputasi inferensi, komputasi waktu uji pada dasarnya memberi model waktu pemrosesan ekstra untuk menyelesaikan tugas, dan mendukung model seperti o1 dan QwQ-32B-Preview.

Follow Berita Techverse.Asia di Google News
Berita Terkait Berita Terkini
Automotive21 Januari 2025, 15:05 WIB

Vespa 946 Snake Hanya Tersedia 888 Unit di Seluruh Dunia

Keanggunan yang dingin untuk model Vespa edisi terbatas baru untuk merayakan Tahun Ular.
Vespa 946 Snake. (Sumber: Vespa)
Automotive21 Januari 2025, 14:37 WIB

Yamaha MT-25 Hadir dengan Banyak Pembaruan, Cuma Ada 1 Varian

Yamaha MT-25 Semakin Tonjolkan Aura “The Master of Torque” yang Agresif.
Yamaha MT-25. (Sumber: Yamaha)
Automotive20 Januari 2025, 19:20 WIB

Kenalkan Produk Indonesia ke Jepang, Saber Industries Berpartisipasi di Osaka Auto Messe 2025

Saber Industries Optimistis Produk Lokal Bisa Memenuhi Ekspektasi Modifikator Jepang.
Ilustrasi lampu mobil yang diproduksi oleh Saber Industries. (Sumber: istimewa)
Techno20 Januari 2025, 19:05 WIB

Samsung Luncurkan 2 Soundbar Baru yang Ditenagai Kecerdasan Buatan

HW-Q990F dan HW-QS700F menawarkan performa yang mumpuni melalui pemanfaatan teknologi AI untuk menciptakan output audio yang imersif.
Soundbar Samsung dari lini Q-Series. (Sumber: Samsung)
Automotive20 Januari 2025, 17:34 WIB

Apparel dan Aksesori Resmi untuk New Honda Scoopy 2025, Tampil Lebih Kalcer

Bagi yang tertarik dengan aksesoris dan apparel New Honda Scoopy 2025 bisa mendatangi diler resmi Honda terdekat atau mengakses website resminya.
New Honda Scoopy 2025 hadir dengan beragam aksesori serta apparel resmi. (Sumber: istimewa)
Techno20 Januari 2025, 17:01 WIB

Shokz OpenFit 2 Hadir dengan Teknologi DualBoost, Segini Harganya

OpenFit 2 menjanjikan suara yang lebih baik dan masa pakai baterai yang lebih lama.
Shokz OpenFit 2. (Sumber: Shokz)
Startup20 Januari 2025, 15:26 WIB

Layanan Tanda Tangan Elektronik dan Sertifikat Privy di Aplikasi Coretax Kini Gratis

Privy adalah penyedia layanan digital trust yang menyediakan layanan identitas dan tanda tangan digital.
Privy.
Techno20 Januari 2025, 14:56 WIB

Hanya 12 Jam Ditutup, Donald Trump 'Selamatkan' Aplikasi TikTok di Amerika Serikat

TikTok sempat tak bisa diakses oleh pengguna di AS sementara waktu karena menghadapi UU pelarangan yang diterbitkan tahun lalu.
Ilustrasi TikTok.
Startup20 Januari 2025, 14:07 WIB

Peak 3 x Lazada Dirikan Joint Venture Baru di Sektor Asuransi Digital

JV baru ini mencerminkan komitmen bersama Peak3 dan Lazada dalam meningkatkan inklusi keuangan dan pembangunan berkelanjutan lewat asuransi digital dan asuransi lekatan.
Lazada x Peak 3. (Sumber: istimewa)
Techno20 Januari 2025, 13:04 WIB

Spek Lengkap Laptop ASUS ExpertBook B3, Ganti Baterai Jadi Lebih Mudah

Mesin AI terintegrasi yang inovatif dengan asisten AI eksklusif ASUS untuk meningkatkan produktivitas sehari-hari.
ASUS ExpertBook B3. (Sumber: ASUS)