Meta Llama 3 Mengklaim AI Generatif Open Source yang Terbaik, Kalahkan Gemini?

Rahmat Jiwandono
Senin 22 April 2024, 17:22 WIB
Logo Meta. (Sumber: Unsplash)

Logo Meta. (Sumber: Unsplash)

Techverse.asia - Meta telah merilis entri terbaru dalam seri model kecerdasan buatan atau Artificial Intelligence (AI) generatif terbuka Llama: Llama 3. Atau, lebih tepatnya, perusahaan telah meluncurkan dua model dalam keluarga Llama 3 barunya, dan sisanya akan hadir pada tanggal mendatang yang belum ditentukan.

Baca Juga: Spesifikasi dan Harga DJI Avata 2, Ditawarkan dalam 3 Opsi Paket

Llama 3 saat ini menampilkan dua bobot model, dengan parameter 8B dan 70B. Angka B di sini diperuntukkan bagi miliaran orang dan menunjukkan betapa kompleksnya suatu model dan seberapa banyak pelatihan yang dipahami model tersebut.

Sejauh ini Llama 3 hanya menawarkan tanggapan berbasis teks, tetapi Meta menyatakan bahwa ini adalah 'lompatan besar' dibandingkan model Llama generasi sebelumnya yakni Llama 2 8B dan Llama 2 70B, dari segi performanya.

Faktanya, Meta mengatakan bahwa untuk jumlah parameternya masing-masing, Llama 3 8B dan Llama 3 70B - yang dilatih pada dua 24.000 cluster GPU yang dibuat khusus - merupakan salah satu model AI generatif dengan performa terbaik yang ada saat ini.

Baca Juga: Selama Ramadan dan Idulfitri 2024, Aktivitas Mobile Gaming Melonjak Sampai 78%

Llama 3 menunjukkan lebih banyak keragaman dalam menjawab pertanyaan, memiliki lebih sedikit penolakan palsu, menolak menjawab pertanyaan, dan dapat memberikan alasan yang lebih baik. Meta juga mengklaim kalau Llama 3 memahami dapat lebih banyak instruksi dan menulis kode lebih baik dari sebelumnya.

Dalam postingan blongya, Meta mengklaim kedua ukuran Llama 3 mengalahkan model berukuran serupa seperti Gemma dan Gemini Google, Mistral 7B, dan Claude 3 dari Anthropic dalam pengujian benchmark tertentu.

Dalam benchmark MMLU, yang biasanya mengukur pengetahuan umum, kinerja Llama 3 8B jauh lebih baik daripada Gemma 7B dan Mistral 7B, sementara itu, Llama 3 70B sedikit mengungguli Gemini Pro 1.5.

Llama 3 70B yang dapat mengalahkan Gemini 1.5 Pro pada MMLU, HumanEval, dan GSM-8K, dan - meskipun tidak menyaingi model Anthropic yang paling berkinerja, Claude 3 Opus - Llama 3 70B mendapat skor lebih baik daripada model terlemah kedua di seri Claude 3, Claude 3 Sonnet, pada lima benchmark (MMLU, GPQA, HumanEval, GSM-8K dan MATH).

Baca Juga: Anthropic Meluncurkan Claude 2.1: Bisa Menganalisis 150.000 Kata di Satu Prompt, dan Lebih Sedikit Jawaban Salah

Meta mengatakan, penilai manusia juga menilai Llama 3 lebih tinggi dibandingkan model lain, termasuk GPT-3.5 milik OpenAI. Perusahaan milik Mark Zuckerberg ini menyebutkan pihaknya menciptakan kumpulan data baru bagi penilai manusia untuk meniru skenario dunia nyata di mana Llama 3 mungkin digunakan.

Kumpulan data itu mencakup kasus penggunaan seperti meminta saran, ringkasan, dan penulisan kreatif. Meta mengatakan tim yang mengerjakan model tersebut tidak memiliki akses ke data evaluasi baru ini, dan hal ini tidak memengaruhi kinerja model.

"Kumpulan evaluasi ini berisi 1.800 petunjuk yang mencakup 12 kasus penggunaan utama: meminta saran, bertukar pikiran, klasifikasi, menjawab pertanyaan tertutup, pengkodean, menulis kreatif, ekstraksi, menghuni karakter/persona, menjawab pertanyaan terbuka, penalaran, menulis ulang, dan meringkas," kata Meta.

Baca Juga: Video Streaming di Twitch Hadir dengan Tampilan Vertikal

Llama 3 diharapkan memiliki ukuran model yang lebih besar (yang dapat memahami rangkaian instruksi dan data yang lebih panjang) dan mampu memberikan respons yang lebih multimodal seperti, hasilkan gambar atau transkripsikan file audio.

Menurut Meta, versi model yang lebih besar ini, yang memiliki lebih dari 400 miliar parameter dan idealnya dapat mempelajari pola yang lebih kompleks dibandingkan versi model yang lebih kecil, saat ini sedang dalam tahap pelatihan, namun pengujian performa awal menunjukkan bahwa model ini dapat menjawab banyak pertanyaan yang diajukan melalui benchmarking.

Namun demikian, Meta tidak merilis pratinjau model yang lebih besar ini, dan tidak membandingkannya dengan model besar lainnya seperti GPT-4.

Baca Juga: Pembaruan GPT-4 Turbo, Lebih Pintar dan Banyak Data Masukan Baru

Follow Berita Techverse.Asia di Google News
Berita Terkait Berita Terkini
Techno03 Mei 2024, 21:19 WIB

Meski Toko Online Menjamur, Orang Indonesia Masih Lebih Suka Belanja Offline

Perasaan bahwa 'melihat langsung produk sebelum membelinya' adalah suatu keharusan.
Konsumen di Indonesia masih belum bisa berhenti belanja offline (Sumber: freepik)
Techno03 Mei 2024, 20:11 WIB

Pemblokiran Gim Online Masih Membutuhkan Kajian Mendalam

Keputusan pemerintah untuk memblokir sebuah gim online perlu mempertimbangkan ekosistem yang terdampak.
Orang tua diminta pantau rating gim anak (Sumber: freepik)
Automotive03 Mei 2024, 19:27 WIB

Hyundai Nexo yang Jadi Kendaraan PLN, Dipamerkan di PEVS 2024

Hyundai Nexo bisa menempuh jarak tempuh maksimal hingga 611 Km dengan emisi hanya berupa air.
Mobil hidrogen PLN sedang berada di Hydrogen Refueling Station (HRS) (Sumber: Kementerian ESDM)
Automotive03 Mei 2024, 18:18 WIB

KYMCO Hadirkan Motor Listrik dengan Baterai Swap, Didukung 40 Titik Stasiun Swap

Agility EV memiliki motor penggerak berdaya maksimal 2.0 KW atau setara 2,6 tenaga kuda, dan kapasitas baterai mampu berakselerasi hingga 50 Km/jam.
KYMCO iONEX (Sumber: KYMCO)
Techno03 Mei 2024, 17:31 WIB

Spotify Diam-diam Menyumbikan Fitur Lirik ke Langganan Berbayar

Untuk saat ini pengguna Spotify di Indonesia masih bisa melihat lirik lagu yang diputar di aplikasi.
Spotify.
Techno03 Mei 2024, 17:29 WIB

Dukung Transformasi Digital dan Kesetaraan Gender, Perempuan Didorong Melek Teknologi AI

Pemerintah menilai perempuan memiliki keunggulan dalam hal kemampuan mengembangan kecerdasan buatan, yaitu adanya perspektif keberagaman
(ilustrasi) Perempuan sedang mempelajari teknologi (Sumber: freepik (dibuat dengan AI))
Techno03 Mei 2024, 17:09 WIB

Mark Zuckerberg Sebut Meta Butuh Waktu Lama untuk Menghasilkan Duit dari AI Generatif

Dia berpesan jangan berharap kalau AI generatif akan menghasilkan keuntungan dalam waktu dekat.
CEO Meta Mark Zuckerberg. (Sumber: Istimewa)
Techno03 Mei 2024, 16:56 WIB

Resmi Rujuk, TikTok dan Universal Music Group Mengakhiri Perseteruan Mereka

Kesepakatan ini meningkatkan perlindungan bagi artis terhadap munculnya AI generatif.
TikTok.
Automotive03 Mei 2024, 16:18 WIB

AIMA Meluncur Ke Indonesia, Bangun Pabrik dan Optimistis Taklukan Pasar

AIMA meluncur ke Indonesia, perusahaan akan membangun sistem pelayanan purna jual lengkap.
AIMA Electric Vehicles (Sumber: AIMA)
Techno03 Mei 2024, 15:39 WIB

Oppo Menjadikan BSS (SEVENTEEN) sebagai Reno Expert

BSS (SEVENTEEN) ditunjuk menjadi wajah baru untuk Oppo Reno11 F 5G terbaru.
Oppo menunjuk boyband BSS (SEVENTEEN) untuk menjadi anggota Reno Expert. (Sumber: Oppo)