OpenAI Rilis GPT-4o Image Generation untuk Pembuatan Gambar

WWW.SINYALMAGZ.COM – OpenAI memulai perjalanan baru aplikasi AI generative-nya, ChatGPT. Kali ini memfokuskan pada pembuatan gambar yang dijuluki GPT-4o Image Generation. Ini adalah model AI dapat menghasilkan gambar berkualitas tinggi dan terperinci serta dapat mengikuti instruksi bahasa alami Anda untuk memodifikasinya hingga Anda mendapatkan gambar yang Anda bayangkan di kepala Anda.

Karena itu salah satu kemampuan yang dikembangkan di antaranya Anda membuat sketsa lebih dulu. Kemudian mengunggah sketsa tersebut ke ChatGPT-4o. AI akan men-generate menjadi gambar yang sesuai. Bahkan obyek foto dapat diganti menjadi obyek lain.

Coba perhatikan rangkaian gambar berikut yang menggunakan materi image atau foto seekor kucing. Kemudian GPT-4o menambahkan prompt lain.

Hingga kemudian menghasilkan gambar akhir seperti berikut;

Seperti kita tahu, versi lama seringkali tidak nyambung antara ide Anda di kepala, lalu dituangkan ke prompt, dan AI melakukan generate sesuai prompt. Akibatnya Anda harus berkali-kali membuat dan menyesuaikan prompt agar pas dengan apa yang Anda inginkan. Walaupun fitur terbaru ChatGPT memberi pertanyaan, namun kadang terlalu lama untuk memahami maksud Anda.

Nah GPT-4o Image Generation digagas dalam rangka semakin mempercepat proses dari gagasan yang ada di kepala Anda menjadi output yang diinginkan.

Pembuatan gambar biasanya dimulai dengan memasukkan perintah teks, lalu Anda menyempurnakan gambar dengan menyempurnakan perintah asli. GPT-4o bekerja secara berbeda – Anda memintanya untuk membuat gambar, lalu memberitahunya apa yang harus diubah, lalu memintanya untuk mengubah lebih banyak hal, dan seterusnya hingga Anda mendapatkan hasil.

Pembuatan gambar GPT‑4o unggul dalam menyajikan teks secara akurat, mengikuti perintah dengan tepat, dan memanfaatkan basis pengetahuan dan konteks obrolan bawaan 4o. Termasuk mengubah gambar yang diunggah atau menggunakannya sebagai inspirasi visual.

Kemampuan ini memudahkan pembuatan gambar sesuai dengan yang Anda bayangkan, membantu Anda berkomunikasi lebih efektif melalui visual, dan memajukan pembuatan gambar menjadi alat praktis dengan presisi dan daya.

OpenAI melakukan banyak eksperimen untuk menghasilkan GPT-4o. Open AI mencoba mempelajari tidak hanya bagaimana gambar berhubungan dengan bahasa, tetapi juga bagaimana gambar tersebut berhubungan satu sama lain. Dikombinasikan dengan pasca-pelatihan yang agresif, model yang dihasilkan memiliki kefasihan visual yang mengejutkan, mampu menghasilkan gambar yang berguna, konsisten, dan sadar konteks.

Kemampuan 4o diantaranya juga untuk memadukan simbol-simbol yang tepat dengan citra mengubah pembuatan gambar menjadi alat untuk komunikasi visual.

Karena pembuatan gambar sekarang menjadi bawaan GPT-4o, Anda dapat menyempurnakan gambar melalui percakapan alami. GPT-4o dapat membangun gambar dan teks dalam konteks obrolan, memastikan konsistensi secara menyeluruh. Misalnya, jika Anda mendesain karakter gim video, penampilan karakter tersebut tetap koheren di beberapa iterasi saat Anda menyempurnakan dan bereksperimen.

Anda juga dapat memulai dengan beberapa gambar dan mengintegrasikan elemen dari setiap gambar ke dalam hasil akhir. OpenAI mengatakan bahwa GPT-4o hebat dalam mengikuti instruksi terperinci – ia dapat memanipulasi 10-20 objek berbeda dalam satu pemandangan tanpa tersandung. Sementara model AI lainnya hanya dapat menangani 5-8 objek. (*)

BACA JUGA: OpenAI Tawarkan Versi Baru ChatGPT Pro

We will be happy to hear your thoughts

Leave a reply

Sinyal Magazine
Login/Register access is temporary disabled