Kini ChatGPT Bisa Menerima Perintah Tulisan, Suara, dan Gambar

Uli Febriarni
Selasa 26 September 2023, 19:29 WIB
simulasi penggunaan ChatGPT dengan memberikan perintah gambar (Sumber: OpenAI)

simulasi penggunaan ChatGPT dengan memberikan perintah gambar (Sumber: OpenAI)

Baca Juga: Ditambahkan ChatGPT, MyTelkomsel Veronika Lebih Pintar

OpenAI meluncurkan versi baru layanan untuk super chatbot mereka, ChatGPT.

Layanan terbarunya memungkinkan pengguna untuk mengaktifkan bot AI itu, tidak hanya dengan mengetikkan kalimat ke dalam prompt perintah, tetapi juga dengan berbicara dengan suara keras atau hanya mengunggah gambar.

Ini mungkin mengingatkan kita dengan Asisten Google dan Google Lens, tapi coba kita baca dulu seperti apa penjelasan dari OpenAI

OpenAI menyatakan bahwa lewat pembaruan ini, mereka menawarkan jenis antarmuka baru yang lebih intuitif dan model yang ditingkatkan.

"Kami meluncurkan [kemampuan perintah] suara dan gambar di ChatGPT kepada pengguna Plus dan Enterprise selama dua pekan ke depan. [Perintah] suara akan hadir di iOS dan Android, kemudian gambar akan tersedia di semua platform," kata OpenAI, seperti dikutip Selasa (26/9/2023).

Menggunakan Perintah Suara

Ketuk tombol yang dilengkapi dengan logo mikrofon, lalu ucapkan pertanyaan atau perintah yang ingin kamu sampaikan.

ChatGPT akan mengubahnya menjadi teks dan memasukkannya ke model bahasa besar. Kemudian, kamu mendapatkan jawaban, sistem mengubahnya kembali menjadi ucapan, dan mengucapkan jawabannya dengan lantang.

"Kami berkolaborasi dengan pengisi suara profesional untuk menciptakan setiap suara. Kami juga menggunakan Whisper, sistem pengenalan ucapan sumber terbuka kami, untuk menyalin kata-kata yang Anda ucapkan ke dalam teks," terang perusahaan.

Untuk fitur suara, pengguna bisa memilih satu dari lima suara berbeda untuk didengarkan. Kemampuan suara baru ini didukung oleh model text-to-speech baru, yang mampu menghasilkan audio mirip manusia hanya dari teks dan contoh ucapan beberapa detik.

OpenAI bekerja sama dengan Spotify, untuk menerjemahkan siniar ke bahasa lain, misalnya, sambil tetap mempertahankan suara podcaster

Baca Juga: Free Fire x Demon Slayer: Dapatkan Item Terbatas dengan Menjalankan Misi Khusus, Mulai Hari Ini!

Menggunakan Perintah Gambar

Untuk memulai, ketuk tombol foto untuk mengambil atau memilih gambar. Jika kamu menggunakan iOS atau Android, ketuk tombol plus terlebih dahulu.

Kamu juga dapat mendiskusikan banyak gambar atau menggunakan alat menggambar yang dimiliki ChatGPT untuk memandu asisten.

Pemahaman gambar didukung oleh multimodal GPT-3.5 dan GPT-4. Model ini menerapkan keterampilan penalaran bahasanya pada berbagai macam gambar, seperti foto, tangkapan layar, dan dokumen yang berisi teks dan gambar.

Baca Juga: Tomps, Platform Digital yang Bantu Kelola Aset Perusahaan Jadi lebih Mudah

Kemampuan Dibangun Bertahap

OpenAI mengaku, perusahaan pada dasarnya ingin membangun Artificial General Intelligence (AGI) yang aman dan bermanfaat. Hal itu jadi alasan mereka menerapkan kemampuan perintah gambar dan suara ini secara bertahap.

Dengan demikian, memungkinkan perusahaan memperbaiki dan menyempurnakan mitigasi risiko dari waktu ke waktu, sekaligus mempersiapkan semua orang untuk sistem yang lebih kuat di masa depan.

Strategi ini menjadi lebih penting dengan model-model canggih yang melibatkan suara dan visi.

"Pengguna mungkin bergantung pada ChatGPT untuk topik khusus, misalnya di bidang seperti penelitian. Kami transparan mengenai keterbatasan model dan tidak menyarankan kasus penggunaan berisiko tinggi tanpa verifikasi yang tepat," terdengar seperti 'disclaimer' dari OpenAI.

Selain itu, model ini mahir dalam menyalin teks bahasa Inggris, namun performanya buruk pada beberapa bahasa lain, terutama yang menggunakan aksara non-romawi. OpenAI menyarankan pengguna non-Inggris agar tidak menggunakan ChatGPT untuk tujuan tersebut.

Baca Juga: Spotify Rilis Jam: Pengguna Lain Bisa Sumbang Lagu ke Playlist

Follow Berita Techverse.Asia di Google News
Berita Terkait Berita Terkini
Techno12 Desember 2025, 19:39 WIB

TicNote Pods: Earbud Pencatat Catatan Bertenaga AI 4G Pertama di Dunia

Earbud ini tersedia dalam dua kelir dan harganya hampir mencapai Rp5 juta.
TicNote Pods. (Sumber: Mobvoi)
Hobby12 Desember 2025, 19:15 WIB

Sinopsis Film Para Perasuk, Ini Daftar Para Pemainnya

Ini adalah film terbaru garapan Wregas Bhanuteja, tapi belum diungkap tanggal rilisnya untuk 2026 mendatang.
Poster film Para Perasuk. (Sumber: istimewa)
Techno12 Desember 2025, 18:00 WIB

Instagram Beri Kendali Atas Algoritma Konten yang Muncul di Reels

Instagram akan memungkinkan penggunanya untuk mengontrol topik mana yang direkomendasikan oleh algoritmanya.
Pengguna bisa mempersonalisasi algoritma Reels yang muncul di Instagram. (Sumber: Instagram)
Lifestyle12 Desember 2025, 17:21 WIB

ASICS Hadirkan Sepatu Padel Sonicsmash FF, Ringan dan Terasa Lebih Lincah

Sepatu padel baru tersebut untuk membuat kecepatan terasa mudah.
ASICS Sonicsmash FF adalah sepatu khusus untuk padel. (Sumber: ASICS)
Techno12 Desember 2025, 15:16 WIB

Jenius x Zurich Luncurkan 2 Proteksi Perjalanan untuk Liburan yang Aman

Jenius adalah aplikasi perbankan digital.
Dua produk proteksi hasil kolaborasi Jenius x Zurich. (Sumber: Jenius)
Startup12 Desember 2025, 15:03 WIB

TransTRACK Raih Halal Logistics Excellence Award

Penghargaan ini didapat dari Halal Development Corporation Berhard pada World Halal Excellence Awards 2024 di Johor, Malaysia.
CEO TransTrack Anggie Meisesari saat menerima Halal Logistics Excellence Award. (Sumber: istimewa)
Techno12 Desember 2025, 14:50 WIB

Samsung Galaxy Watch Mendukung Pembayaran QRIS Tap di Aplikasi myBCA

QRIS Tap myBCA hadi di Samsung Galaxy Watch, bertransaksi kian praktis.
Transaksi pakai QRIS Tap myBCA kini bisa dilakukan langsung dari pergelangan tangan. (Sumber: Samsung)
Automotive12 Desember 2025, 14:08 WIB

Kawasaki Z1100 ABS MY2026 Dipasarkan di Indonesia, Harga Hampir Rp400 Juta

Performanya semakin buas dan agresif.
Kawasaki Z1100 ABS MY2026. (Sumber: Kawasaki)
Startup11 Desember 2025, 19:20 WIB

MDI Portofolio Impact Report 2025: 8 Startup Diklaim Beri Dampak Nyata

MDI Ventures melihat laporan-laporan ini bukan sekadar dokumen tahunan, tetapi sebagai landasan untuk pengambilan keputusan.
MDI Ventures.
Techno11 Desember 2025, 18:15 WIB

Pebble Hadirkan Index 01: Cincin Pintar untuk Merekam Pikiran

Tangkap ide-ide terbaikmu sebelum ide-ide itu hilang begitu saja.
Pebble Index 01. (Sumber: Pebble)