Grok 1.5V di xAI Bisa Memproses Dokumen hingga Gambar

Rahmat Jiwandono
Kamis 18 April 2024, 18:12 WIB
xAI Grok 1.5. (Sumber: xAI)

xAI Grok 1.5. (Sumber: xAI)

Techverse.asia - Perusahaan teknologi kecedasan buatan xAI, pesaing OpenAI yang didirikan oleh Elon Musk, telah memperkenalkan Grok versi pertama yang dapat memproses informasi visual. Grok 1.5V adalah model AI multimodal generasi pertama perusahaan, yang tidak hanya memproses teks, tetapi juga dokumen, diagram, bagan, tangkapan layar, dan foto.

Dalam pengumuman xAI, ia memberikan beberapa contoh bagaimana kemampuannya dapat digunakan di dunia nyata. Kamu dapat, misalnya, menunjukkan foto diagram alur dan meminta Grok menerjemahkannya ke dalam kode Python, memintanya menulis cerita berdasarkan gambar, dan bahkan menjelaskan meme yang tidak kamu pahami.

Hei, tidak semua orang bisa mengikuti semua yang dilontarkan internet.

Baca Juga: AI Milik Apple Ingin Kalahkan GPT-4, Mampu Pahami Petunjuk Konteks

Versi baru ini hadir hanya beberapa minggu setelah perusahaan meluncurkan Grok-1.5. Model tersebut dirancang agar lebih baik dalam pengkodean dan matematika dibandingkan pendahulunya, serta mampu memproses konteks yang lebih panjang sehingga dapat memeriksa data dari lebih banyak sumber untuk lebih memahami pertanyaan tertentu.

xAI mengatakan bahwa penguji awal dan pengguna lama akan segera dapat menikmati kemampuan Grok-1.5V, meskipun tidak memberikan waktu pasti peluncurannya.

Selain memperkenalkan Grok-1.5V, perusahaan juga telah merilis kumpulan data benchmark yang disebut RealWorldQA. Kamu dapat menggunakan salah satu dari 700 gambar RealWorldQA untuk mengevaluasi model AI: setiap item dilengkapi dengan pertanyaan dan jawaban yang dapat diverifikasi dengan mudah, tetapi mungkin membuat model multimodal seperti Grok bingung.

xAI mengklaim kalau teknologinya mendapat skor tertinggi ketika perusahaan mengujinya dengan RealWorldQA melawan pesaing, seperti GPT-4V OpenAI dan Google Gemini Pro 1.5.

Baca Juga: Elon Musk Butuh Uang Sebanyak Satu Miliar Dolar untuk Mendanai xAI

Open source

xAI memiliki kode dasar model Grok AI yang bersifat open source, tetapi tanpa kode pelatihan apapun. Perusahaan menggambarkannya sebagai model Mixture-of-Expert dengan 314 miliar parameter di GitHub.

Hal ini akan memungkinkan para peneliti dan pengembang untuk mengembangkan model dan memengaruhi cara xAI memperbarui Grok di masa depan saat ia bersaing dengan teknologi pesaing dari OpenAI, Meta, Google, dan lainnya.

Dalam postingan blognya, xAI mengatakan bahwa model tersebut tidak disesuaikan untuk aplikasi tertentu seperti menggunakannya untuk percakapan. Perusahaan juga mencatat bahwa Grok-1 dilatih pada tumpukan khusus tanpa menentukan rinciannya.

Baca Juga: Google Hadirkan Gemini Ultra, Harus Berlangganan untuk Bisa Memakainya

Model ini dilisensikan di bawah Apache License 2.0, yang mengizinkan kasus penggunaan komersial, namun tidak menyertakan data yang digunakan untuk melatihnya atau koneksi ke X untuk data secara real-time.

Pada November tahun lalu xAI dalam posting blognya menuliskan bahwa model bahasa besar (LLM) Grok dikembangkan selama empat bulan terakhir dan ditargetkan untuk penggunaan seputar pembuatan kode, penulisan kreatif, dan menjawab pertanyaan.

Setelah Elon Musk membeli Twitter (sekarang X), kode di balik algoritmanya akhirnya dirilis pada pekan kemarin, dan Elon Musk secara terbuka mengkritik perusahaan yang tidak menjadikan model AI mereka sebagai sumber yang terbuka dan dapat diakses umum.

Hal tersebut juga berlaku untuk OpenAI, yang ia bantu dirikan perusahaannya namun kini digugat, dengan tuduhan bahwa perusahaan yang dipimpin Sam Altman itu melanggar perjanjian pendirian awal bahwa perusahaan tersebut akan menjadi open source.

Baca Juga: OpenAI dan Google Menranskrip Video dari YouTube untuk Melatih AI

Perusahaan telah merilis model sumber terbuka atau sumber terbuka terbatas untuk mendapatkan masukan dari peneliti lain tentang cara memperbaikinya. Meskipun ada banyak model dasar AI yang sepenuhnya bersumber terbuka seperti Mistral dan Falcon, model yang paling banyak digunakan adalah model sumber tertutup atau menawarkan lisensi terbuka terbatas.

Follow Berita Techverse.Asia di Google News
Berita Terkait Berita Terkini
Lifestyle18 Juli 2025, 17:57 WIB

Hearts2Hearts Resmi Menjadi Duta Merek untuk Barenbliss Indonesia

Ada promo menarik bagi setiap pembelian produk tertentu selama masih berlangsung di e-commerce Shopee.
Hearts2Hearts menjadi duta merek untuk Barenbliss. (Sumber: dok. barenbliss)
Lifestyle18 Juli 2025, 16:46 WIB

Quiet Quitting: Cermin Krisis Budaya Kerja, Bukan Sekadar Trend Generasi Z

Adanya perbedaan pola pikir antara Gen X dan Gen Z bisa memicu terjadinya quiet quitting.
(ilustrasi) karyawan generasi Z resign dari perusahaan (Sumber: freepik)
Techno18 Juli 2025, 16:31 WIB

TikTok Memikat Para Penulis Lagu dengan Fitur Promosi Baru

Ini akan memungkinkan para penulis lagu dan produser untuk menyoroti lagu-lagu yang mereka tulis atau yang mereka tulis bersama.
Deskripsi pekerjaan sebagai seorang penulis lagu di akun TikTok. (Sumber: TikTok)
Techno18 Juli 2025, 16:07 WIB

Spesifikasi Wacom MovinkPad 11, Tablet Kreatif All-in-One

Alat ini merupakan papan tulis kreatif portabel terobosan yang mendefinisikan ulang apa itu perangkat gambar digital.
Wacom MovinkPad 11. (Sumber: Wacom)
Automotive18 Juli 2025, 15:22 WIB

Jeep Resmi Memperkenalkan 2 Model Wagoneer Edisi Khusus Baru

Jeep hadirkan kemampuan off-road legendaris, teknologi canggih, dan fleksibilitas bagi mereka yang mencari petualangan.
Jeep Wagoneer Super. (Sumber: Jeep)
Automotive18 Juli 2025, 15:07 WIB

Ford Mustang Segera Meluncur di GIIAS 2025

Nantikan Kolaborasi Ikonik hingga Debut Sang Legenda.
Deretan mobil Ford yang akan ditampilkan di gelaran GIIAS 2025. (Sumber: Ford)
Techno18 Juli 2025, 14:28 WIB

LG Bawa Teknologi AI ke Laptop LG Gram Pro Terbarunya

Model LG Gram Pro 16 dan 17 inci terbaru menggabungkan performa AI hibrida dengan portabilitas ultra.
LG Gram Pro. (Sumber: LG)
Techno18 Juli 2025, 14:09 WIB

Sony LinkBuds Fit Kini Tersedia Dalam Warna Pink

Menambah opsi warna yang sudah ada sebelumnya pada earbud tersebut.
Sony LinkBuds Fit hadirkan warna pink. (Sumber: Sony)
Techno17 Juli 2025, 19:44 WIB

Telkomsel x TikTok x GoPay Luncurkan Kartu Perdana Simpati TikTok Edisi Khusus

Ini menjadi wujud nyata dalam mendorong inklusi digital yang bermakna dan memperkuat pertumbuhan ekonomi kreatif digital.
Telkomsel x TikTok x GoPay hadirkan kartu perdana Simpati edisi khusus. (Sumber: istimewa)
Travel17 Juli 2025, 19:06 WIB

Kementerian Pariwisata Perkenalkan Event By Indonesia: Akun Resmi Penyedia Informasi Event

Platform ini akan mempermudah dalam Masyarakat Dapatkan Informasi Event di Seluruh Indonesia
Event By Indonesia mempermudah masyarakat mendapatkan informasi event di seluruh Indonesia. (Sumber: Kementerian Pariwisata)