Google meningkatkan pengeditan gambar Gemini dengan model pisang nano

Gemini lebih baik dalam mengedit gambar Anda dengan pembaruan model baru dari Google DeepMind.

Model, yang naik ke puncak papan peringkat Lmarena di bawah alias “nano pisang,” sebenarnya disebut gambar flash Gemini 2.5. Tim Google DeepMind mengatakan model ini telah dilatih untuk membuat subjek lebih konsisten di berbagai suntingan gambar yang dihasilkan AI. Ini telah menjadi masalah bagi model gambar AI, mengingat sifatnya yang tidak terduga.

Lihat juga:

Apple Eyes Google Gemini untuk Upgrade Siri

Kemampuan untuk mengunggah dan mengedit foto secara asli di Gemini telah ada sejak April tahun ini. Alih -alih mempelajari seluk beluk teknis dari perangkat lunak pengeditan foto seperti Photoshop, pengguna dapat mengunggah gambar ke Gemini dan menggambarkan perubahan yang mereka inginkan secara sederhana, tidak diperlukan jargon. Dengan model Gemini yang diperbarui, Google mengatakan Anda dapat melakukan hal -hal seperti mengubah pakaian dan lokasi subjek, sambil menjaga kemiripannya tetap sama.

Kecepatan cahaya yang dapat dipasangkan

Anda juga dapat mengunggah beberapa foto dan membuat subjek muncul bersama di foto yang sama, atau menambah dan mengubah detail spesifik dalam gambar yang diunggah untuk, katakanlah, lihat seperti apa ruangan dengan warna cat yang berbeda atau furnitur yang berbeda.

Inilah upaya Gemini untuk mengedit anjing saya ke dalam pose anjing ke bawah dan memindahkannya ke studio yoga. Kemiripannya sama, dan itu berhasil mengedit gambar untuk membuat matanya terbuka, tetapi tubuhnya tidak melengkung seperti yang seharusnya. (Saya akan tahu, saya telah melihat pose lucu ini berkali -kali.)

Ini anjing saya Lola, tidak melakukan yoga
Kredit: Mashable

Gambar anjing yang dihasilkan AI melakukan pose anjing ke bawah dalam studip yoga

Inilah versi yang diedit Gemini ketika saya mendorongnya untuk membuka matanya, menempatkannya dalam pose anjing ke bawah, dan mengubah latar belakang ke studio yoga. Itu dekat, tapi tidak benar.
Kredit: Mashable

Seperti yang dikatakan Google Deepmind dalam pengumumannya, model mungkin tidak selalu melakukannya dengan benar. Mungkin masih ada ketidakakuratan dengan detail halus, teks dalam gambar, dan ketidakkonsistenan. Dengan percobaan saya, bulu anjing saya terlihat terlalu halus, tetapi keseluruhan pewarnaan, ukuran, dan bentuknya tetap sama. Semua gambar memiliki tanda air yang terlihat dan tanda air yang tidak terlihat yang disebut Synthid untuk mengurangi kebingungan tentang apakah mereka nyata atau dihasilkan AI. Pembaruan ini sekarang langsung, sehingga Anda dapat mencobanya sendiri di aplikasi Gemini.

Topik
Kecerdasan Buatan Google Gemini