Images 2.0 Milik ChatGPT Kini Jago Render Teks, Bisa Buat Komik hingga Menu Restoran
BeritaNasional.com - OpenAI baru saja memperkenalkan Images 2.0, model penghasil gambar terbaru yang disematkan pada ChatGPT. Hasilnya dinilai luar biasa akurat, terutama dalam urusan rendering teks.
Secara historis, generator gambar AI memang kesulitan mengeja. Sebab, model lama seperti model difusi bekerja dengan cara merekonstruksi gambar dari noise (gangguan visual).
CEO Lesan AI Asmelash Teka Hadgu sempat menjelaskan, pada 2024, tulisan dalam gambar sering dianggap sebagai pola kecil oleh AI sehingga kerap terabaikan atau salah dibentuk.
Namun, model terbaru ini diduga menggunakan mekanisme berbeda yang lebih mirip dengan cara kerja Large Language Model (LLM) sehingga ia bisa memprediksi bagaimana seharusnya teks ditampilkan.
Menariknya, dalam konferensi pers minggu ini, OpenAI memilih bungkam mengenai detail teknis model apa yang sebenarnya mendukung Images 2.0.
Lebih Pintar
Images 2.0 bukan sekadar generator gambar biasa. OpenAI menjelaskan model ini memiliki kemampuan berpikir yang memungkinkan ia melakukan hal-hal berikut:
- Browsing Web: Mencari referensi terkini di internet.
- Multitasking: Menghasilkan banyak gambar dari satu perintah tunggal.
- Cek Mandiri: Memeriksa kembali hasil karyanya untuk meminimalkan kesalahan.
Berkat kemampuan ini, Images 2.0 mampu menciptakan aset pemasaran dalam berbagai ukuran hingga komik strip multi-panel yang konsisten hanya dalam hitungan menit.
Selain itu, dukungan teksnya kini merambah ke aksara non-Latin seperti Jepang, Korea, Hindi, dan Bengali dengan akurasi tinggi.
Dalam pernyataan resminya, OpenAI mengeklaim bahwa model ini membawa tingkat spesifikasi yang belum pernah ada sebelumnya.
"Images 2.0 menghadirkan tingkat spesifikasi dan ketelitian yang belum pernah terjadi sebelumnya dalam pembuatan gambar. Ia tidak hanya dapat mengonseptualisasikan gambar yang lebih canggih, tetapi juga secara efektif mewujudkan visi tersebut, mampu mengikuti instruksi, mempertahankan detail yang diminta, dan merender elemen-elemen halus yang seringkali merusak model gambar: teks kecil, ikonografi, elemen UI, komposisi padat, dan batasan gaya yang halus, semuanya hingga resolusi 2K," tulis OpenAI.
Meski proses pembuatannya tidak secepat mengetik pertanyaan teks biasa di ChatGPT, kualitas yang dihasilkan sebanding dengan waktu tunggunya.
Kapan Bisa Dicoba?
Kabar baik bagi para pengguna! Seluruh pengguna ChatGPT dan Codex sudah mulai bisa mengakses Images 2.0 sejak Selasa pekan ini.
- Pengguna Gratis: Bisa mencicipi kecanggihan standarnya.
- Pengguna Berbayar: Akan mendapatkan akses ke output yang lebih canggih dan kompleks.
- Pengembang: OpenAI menyediakan API gpt-image-2 dengan skema harga yang bergantung pada kualitas dan resolusi output.
Namun, perlu diingat bahwa pangkalan data pengetahuan model ini berakhir pada Desember 2025.
Jadi, untuk permintaan yang berkaitan dengan berita yang sangat baru di tahun 2026, tingkat akurasinya mungkin akan sedikit terpengaruh.
EKBIS | 1 hari yang lalu
EKBIS | 1 hari yang lalu
TEKNOLOGI | 1 hari yang lalu
TEKNOLOGI | 1 hari yang lalu
HUKUM | 1 hari yang lalu
HUKUM | 1 hari yang lalu
PERISTIWA | 1 hari yang lalu
PERISTIWA | 18 jam yang lalu
EKBIS | 22 jam yang lalu
TEKNOLOGI | 1 hari yang lalu







