Apple Sedang Kerjakan MGIE, Bisa Edit Gambar Berdasarkan Perintah Berbasis Teks

Rahmat Jiwandono
Jumat 09 Februari 2024, 15:48 WIB
MGIE milik Apple yang bisa mengubah input teks menjadi gambar. (Sumber: Apple)

MGIE milik Apple yang bisa mengubah input teks menjadi gambar. (Sumber: Apple)

Techverse.asia - Apple memang bukanlah salah satu pemain terbaik dalam bidang kecerdasan buatan atau Artificial Intelligence (AI) saat ini, namun model AI open source baru untuk pengeditan gambar menunjukkan kemampuannya dalam berkontribusi terhadap bidang AI.

Model itu disebut dengan MLLM-Guided Image Editing (MGIE), yang menggunakan model bahasa besar multimodal (MLLM) untuk menafsirkan perintah berbasis teks saat memanipulasi gambar.

Dengan kata lain, model MGIE, yang sedang dikerjakan Apple bersama Universitas California, Santa Barbara, dapat memotong, mengubah ukuran, membalik, dan menambahkan filter ke gambar melalui perintah teks.

Meskipun ini bukan alat pertama yang dapat melakukan hal tersebut, 'instruksi manusia terkadang terlalu singkat untuk ditangkap dan diikuti oleh metode saat ini,' demikian tertulis dalam makalah proyek (PDF) itu.

Baca Juga: Google Merilis Alat GenAI untuk Pembuatan Musik, MusicFX dan TextFX

MGIE dapat diterapkan pada tugas penyuntingan gambar yang sederhana dan lebih kompleks seperti memodifikasi objek tertentu dalam foto untuk menjadikannya bentuk yang berbeda atau menjadi lebih cerah. Model ini memadukan dua penggunaan model bahasa multimodal yang berbeda.

MLLM memiliki kekuatan untuk mengubah perintah teks sederhana atau ambigu menjadi instruksi yang lebih rinci dan jelas yang dapat diikuti oleh editor foto.

Pertama, ia mempelajari cara menafsirkan perintah pengguna. Kemudian ia 'membayangkan' seperti apa hasil editannya, misalnya, meminta langit yang lebih biru pada foto berarti menaikkan kecerahan pada bagian langit suatu gambar.

Misalnya juga, jika pengguna ingin mengedit foto pizza pepperoni untuk 'membuatnya lebih sehat', MLLM dapat menafsirkannya sebagai tambahkan topping sayuran dan edit foto tersebut.

Baca Juga: Apple Sedang Membuat iPhone dan iPad yang Dapat Dilipat?

Atau foto harimau di Gurun Sahara tampak gelap, tapi setelah memberi tahu model untuk menambahkan lebih banyak kontras untuk menyimulasikan lebih banyak cahaya, gambarnya tampak menjadi lebih cerah.

Selain melakukan perubahan besar pada gambar, MGIE juga dapat memotong, mengubah ukuran dan memutar foto, serta meningkatkan kecerahan, kontras, dan keseimbangan warna, semuanya melalui petunjuk teks.

Ia juga dapat mengedit area tertentu pada foto dan, misalnya, memodifikasi rambut, mata, dan pakaian orang yang ada di dalamnya, atau menghapus elemen di latar belakang.

“Alih-alih memberikan panduan yang singkat tapi ambigu, MGIE memperoleh maksud sadar visual yang eksplisit dan mengarah pada pengeditan gambar yang wajar. Kami melakukan studi ekstensif dari berbagai aspek pengeditan dan menunjukkan bahwa MGIE kami secara efektif meningkatkan kinerja sekaligus menjaga efisiensi kompetitif.”

Baca Juga: Rumor Bocoran iPhone 16: Desain Kamera Beda, Peningkatan RAM, dan Kapasitas Baterai

“Kami juga percaya kerangka kerja yang dipandu MLLM dapat berkontribusi pada penelitian visi dan bahasa di masa depan,” kata para peneliti dalam makalah tersebut dilansir, Jumat (9/2/2024).

Seperti yang dicatat oleh VentureBeat, Apple merilis model tersebut melalui GitHub, tetapi mereka yang tertarik juga dapat mencoba demo yang saat ini di-hosting di Hugging Face Spaces.

Kendati demikian, Apple belum mengatakan apakah mereka berencana untuk menggunakan apa yang dipelajari dari proyek ini ke dalam alat atau fitur yang dapat dimasukkan ke dalam produknya.

Beberapa platform pembuatan gambar, seperti DALL-E 3 OpenAI, dapat melakukan tugas pengeditan foto sederhana pada gambar yang mereka buat melalui input teks. Pencipta Photoshop, Adobe, yang digunakan kebanyakan orang untuk mengedit gambar, juga memiliki model pengeditan AI sendiri.

Model Firefly AI-nya mendukung pengisian generatif, yang menambahkan latar belakang yang dihasilkan ke foto.

Baca Juga: Mindvalley Rilis Aplikasi Pengembangan Pribadi dan Meditasi di Apple Vision Pro

Apple belum menjadi pemain besar dalam bidang AI generatif, tidak seperti Microsoft, Meta, atau Google, namun CEO Apple Tim Cook menyatakan bahwa perusahaannya ingin menambahkan lebih banyak fitur AI ke perangkatnya tahun ini.

Pada Desember 2023, peneliti Apple merilis kerangka pembelajaran mesin sumber terbuka yang disebut MLX untuk mempermudah pelatihan model AI pada chip Apple Silicon.

Follow Berita Techverse.Asia di Google News
Berita Terkait Berita Terkini
Techno27 Juli 2024, 15:51 WIB

ASUS Umumkan Perilisan Hardware Kelas Server dengan Dukungan AMD EPYC 4004

Hardware ASUS kelas server dengan prosesor AMD EPYC™ 4004 menonjolkan performa dan densitas tingkat tinggi.
AMD EPYC™ 4004 (Sumber: Asus)
Techno27 Juli 2024, 14:35 WIB

DeepL Menambahkan Aksara Mandarin Tradisional di Pilihan Bahasa Terjemahan

Dengan kehadiran bahasa Mandarin tradisional ini, jumlah total bahasa yang dimiliki DeepL menjadi 33 bahasa,
(ilustrasi) DeepL menambahkan translasi ke aksara Mandarin tradisional (Sumber: DeepL)
Automotive27 Juli 2024, 13:36 WIB

Delta Electronics Kenalkan Aneka Solusi Pengisian Daya Mobil Listrik Termutakhir

Rangkaian produk dan layanan TEB dapat mempermudah pemasangan dan peningkatan infrastruktur charging station di rumah, gedung, dan ruang publik.
Delta Pamerkan Inovasi Pengisian Daya Mutakhir di GIIAS 2024 (Sumber: Delta)
Automotive27 Juli 2024, 12:35 WIB

Subaru Bawa Produk Edisi Terbatas di GIIAS 2024 & Umumkan Belum Akan Fokus Elektrifikasi

Subaru membawa SUV Subaru ADVENTURE Edition (Crosstrek dan Forester), Subaru BRZ dengan paket STI Performance Parts, dan Subaru WRX M/T dengan EyeSight terbaru.
Subaru BRZ dengan STI Performance Parts (Sumber: Subaru)
Automotive27 Juli 2024, 11:50 WIB

Mejeng di GIIAS 2024, Lebih dari 100 Unit IONIQ 5 N Diborong Konsumen

Angka pembelian mencapai tiga digit itu, berasal dari penjualan melalui website dan tenaga sales Hyundai.
Mejeng di GIIAS 2024, lebih dari 100 unit Hyundai Ioniq 5 N dipesan (Sumber: Hyundai Indonesia)
Automotive26 Juli 2024, 20:36 WIB

Nissan Sakura dan Ariya Mejeng di GIIAS 2024, Begini Spek Mesinnya

Dua mobil listrik ini termasuk kategori BEV.
Nissan Ariya dan Sakura debut di GIIAS 2024. (Sumber: Nissan)
Automotive26 Juli 2024, 19:19 WIB

GIIAS 2024: Isuzu Meluncurkan MU-X dan D-Max Single Cabin 2024

Dua mobil ini mumpuni untuk melintasi berbagai wilayah off-road.
Isuzu mengumumkan MU-X dan D-Max SC di GIIAS 2024. (Sumber: isuzu)
Techno26 Juli 2024, 18:17 WIB

Google Update Play Store dengan Ulasan Aplikasi Bertenaga Kecerdasan Buatan

Pembaruan fitur ini sudah tersedia untuk semua pengguna Android.
Google Play Store kini ditenagai dengan kecerdasan buatan. (Sumber: Google)
Techno26 Juli 2024, 16:48 WIB

Butuh Kolaborasi dan Tindak Lanjut dari Pemerintah untuk Transformasi Digital Indonesia

Indonesia menjadi salah satu destinasi investasi digital yang menggiurkan.
Ilustrasi transformasi digital. (Sumber: freepik)
Startup26 Juli 2024, 16:29 WIB

Koltiva Dukung Pemkab Aceh Singkil: Tandatangani MoU Tata Kelola Kelapa Sawit

Kolaborasi ini juga ditandai dengan peluncuran dasbor Multi Stakeholder Forum (MSF) Aceh Singkil
Koltiva dan Pemkab Aceh Singkil tandatangani MoU tentang tata kelola kelapa sawit.