OpenAI kembali memperbarui kemampuan ChatGPT dengan menghadirkan mesin pembuat gambar terbaru bernama GPT-Image-1.5. Model ini diperkenalkan sebagai penerus generasi sebelumnya dengan fokus utama pada kecepatan, akurasi, dan kemudahan penggunaan. OpenAI mengeklaim GPT-Image-1.5 mampu menghasilkan gambar hingga empat kali lebih cepat, sekaligus memberikan hasil visual yang lebih konsisten dan presisi mengikuti perintah pengguna.
Pembaruan ini menempatkan ChatGPT semakin serius sebagai alat kreasi visual, bukan sekadar chatbot berbasis teks. Dalam penjelasan resmi OpenAI yang dirangkum dari laporan The Decoder, GPT-Image-1.5 dikembangkan untuk menjawab kebutuhan pengguna yang semakin beragam. Mulai dari kebutuhan kreatif personal, hingga penggunaan profesional seperti desain pemasaran, simulasi produk, materi presentasi, dan pengeditan foto.
Salah satu peningkatan paling menonjol adalah kemampuan mengedit bagian tertentu dari sebuah gambar tanpa mengubah elemen lain. Pada model lama, permintaan edit sering menghasilkan gambar baru yang berbeda jauh dari versi awal. Dengan GPT-Image-1.5, pengguna dapat meminta perubahan spesifik, misalnya mengganti warna objek atau menambahkan elemen kecil, tanpa mengganggu pencahayaan, komposisi, maupun detail wajah.
Kemampuan ini dinilai krusial bagi kebutuhan desain modern yang menuntut presisi tinggi. Dalam konteks pemasaran produk, misalnya, satu kesalahan kecil pada detail visual dapat memengaruhi persepsi konsumen. GPT-Image-1.5 dirancang agar perubahan bersifat lokal dan terkontrol, sehingga hasil akhir tetap konsisten.
OpenAI juga memperbaiki kemampuan pembacaan dan penulisan teks di dalam gambar. Masalah teks yang tidak terbaca, terpotong, atau salah ejaan menjadi keluhan umum pada generasi AI pembuat gambar sebelumnya. GPT-Image-1.5 diklaim lebih stabil dalam menampilkan teks kecil dan padat, yang sering digunakan pada poster promosi, infografik, dan slide presentasi.
Selain peningkatan kualitas, OpenAI juga mengoptimalkan alur kerja pengguna. ChatGPT kini memungkinkan pembuatan beberapa gambar secara bersamaan. Pengguna dapat melanjutkan perintah lain tanpa harus menunggu satu proses selesai. Pendekatan ini membuat proses eksplorasi visual menjadi lebih cepat dan efisien, terutama bagi kreator yang membutuhkan banyak variasi dalam waktu singkat.
Untuk mendukung pengalaman tersebut, OpenAI memperkenalkan tab khusus bernama “Images” di aplikasi ChatGPT. Tab ini memisahkan pembuatan gambar dari percakapan teks reguler. Dengan demikian, pengguna tidak perlu lagi mencampur perintah visual dengan obrolan lain yang bersifat informatif atau diskusi.
Tab Images tersedia di sidebar ChatGPT, baik pada versi web maupun aplikasi mobile. Di dalamnya, pengguna dapat langsung memilih berbagai preset gaya visual, filter, dan contoh prompt populer. Fitur ini dirancang agar pengguna awam dapat mencoba pembuatan gambar tanpa harus memahami struktur prompt yang kompleks.
Salah satu fitur yang menarik perhatian adalah kemampuan menyimpan likeness atau tampilan wajah. Pengguna cukup mengunggah satu foto, lalu sistem dapat menggunakan referensi tersebut untuk berbagai pembuatan gambar berikutnya. Fitur ini memudahkan pengguna yang ingin membuat variasi visual dengan karakter yang sama, tanpa perlu mengunggah ulang gambar referensi setiap kali.
Dari sisi ketersediaan, GPT-Image-1.5 dan tab Images mulai digulirkan secara bertahap untuk seluruh pengguna ChatGPT, baik gratis maupun berbayar. Berdasarkan pemantauan pada 17 Desember 2025, fitur ini sudah dapat diakses oleh pengguna ChatGPT versi desktop dan mobile di Indonesia. Sementara itu, OpenAI menyebutkan bahwa pengguna Business dan Enterprise akan mendapatkan akses menyusul.
Model GPT-Image-1.5 juga tersedia melalui API OpenAI. Perusahaan mengeklaim biaya input dan output gambar lebih hemat dibanding generasi sebelumnya. Klaim ini penting bagi pengembang aplikasi dan layanan yang mengintegrasikan generasi gambar AI dalam skala besar, karena efisiensi biaya menjadi faktor utama dalam adopsi teknologi.
Dalam hal performa, GPT-Image-1.5 kerap dibandingkan dengan Nano Banana Pro, mesin pembuat gambar dari Google. Berdasarkan laporan The Decoder, GPT-Image-1.5 dinilai setara dalam memahami instruksi rumit yang melibatkan banyak objek, relasi visual yang tidak lazim, serta detail fotorealistik pada adegan kompleks.
Model ini juga disebut lebih mampu menangani elemen abstrak, seperti manusia dan hewan dalam posisi tidak biasa. Tantangan semacam ini sebelumnya sering menghasilkan gambar yang tidak proporsional atau kehilangan detail penting.
Meski performanya dinilai setara, pendekatan visual keduanya memiliki perbedaan. GPT-Image-1.5 cenderung menghasilkan gambar dengan nuansa sinematik dan tampilan yang terasa lebih terkurasi. Sementara itu, Nano Banana Pro sering dianggap lebih literal dan menyerupai foto kasual. Perbedaan ini menunjukkan bahwa gaya visual masih sangat dipengaruhi oleh filosofi pengembangan masing-masing perusahaan.
Pada akhirnya, hasil gambar tetap sangat bergantung pada cara pengguna menyusun prompt dan preferensi visual masing-masing. Namun dengan kecepatan yang meningkat, kemampuan edit yang lebih presisi, serta antarmuka khusus melalui tab Images, OpenAI menunjukkan arah yang jelas. ChatGPT tidak lagi hanya berfokus pada teks, tetapi berkembang menjadi platform kreasi visual yang praktis, efisien, dan semakin kompetitif di tengah persaingan AI generatif global.
