Saya menguji grok bayangkan, dan tidak cocok untuk Google Veo 3 atau Sora

Selama akhir pekan, perusahaan kecerdasan buatan Elon Musk Xai merilis Grok Imagine, alat AI generatif baru untuk menghasilkan gambar dan video. Grok Imagine sekarang tersedia untuk pelanggan XAI yang dibayar di aplikasi Grok iOS dan Android.

Musk telah menghembuskan proyek di X, berbagi foto dan video dari pengguna Grok. Ini termasuk beberapa konten NSFW yang ringan, yang dilabeli oleh Aplikasi Grok sebagai “pedas.”

Video AI adalah perbatasan baru yang menarik – dan terus terang – untuk industri AI. Bagi para pendukung, teknologi ini memberi para seniman media baru untuk kreativitas dan dapat mengurangi biaya animasi dan pembuatan film. Bagi para kritikus, video AI menimbulkan risiko serius bagi Deepfake seksual dan informasi yang salah.

Mengesampingkan debat itu untuk saat ini, saya ingin melihat seberapa baik Grok Imagine dibandingkan dengan saingan terbesar Xai. Seperti yang saya tulis sebelumnya, model video AI VEO 3 Google saat ini memimpin dengan Field dengan video yang sangat hidup. Lalu ada Sora, dari pembuat chatgpt Openai. Selain itu, Midjourney Generator Gambar AI yang populer baru -baru ini memperkenalkan alat video AI generatifnya sendiri.

Jadi, bagaimana Grok Imagine dibandingkan dengan para pesaingnya? Menjadi tumpul, saya tidak terkesan.

Ya, Grok Imagine baru, dan Musk baru -baru ini mengatakan pada X bahwa itu “harus menjadi lebih baik setiap hari.” Namun, pada tulisan ini, tampaknya jauh di belakang para pesaingnya.

Biarkan saya menunjukkan pekerjaan saya.

Membandingkan Grok Imagine AI Video dengan kompetisi

Mashable baru -baru ini menulis tentang tren video AI viral – rekaman kamera keamanan hewan melompat pada trampolin dan terlibat dalam kejenakaan yang sama. Jadi, saya menggunakan prompt sederhana untuk menguji Grok Imagine, Veo 3, Sora, dan Midjourney: “Cuplikan kamera keamanan kelinci melompat pada trampolin di malam hari.” Cukup sederhana, bukan?

Pertama, saya harus mencatat bahwa ada perbedaan besar antara Veo 3 dan Grok Imagine. Model Google VEO 3 dapat menghasilkan video berdasarkan prompt teks. Cukup jelaskan video yang Anda inginkan, dan Veo 3 akan melakukan sisanya. Namun, alat-alat seperti Midjourney dan Grok Imagine hanya menawarkan generasi teks-ke-gambar. Setelah menghasilkan atau mengunggah gambar, pengguna kemudian dapat menghidupkannya, mengubahnya menjadi klip video pendek. Dalam hal ini, Grok Imagine sudah berada di kaki belakang dibandingkan dengan Openai dan Google.

Kecepatan cahaya yang dapat dipasangkan

Dengan peringatan itu, mari selami hasilnya, yang juga saya bagikan di X.

Saya memasukkan prompt tes saya ke Grok, dan itu mengembalikan gambar -gambar yang mengecewakan ini.

Kredit: Screenshot milik Grok / Timothy Beck Werth

Screenshot dari Aplikasi Grok yang menunjukkan gambar kelinci yang dihasilkan AI pada trampolin

Kredit: Screenshot milik Grok / Timothy Beck Werth

Saya memilih yang paling buruk dari gambar -gambar ini dan membuat video pendek ini:

Itu … baik? Jenis pertengahan, atau mehseperti yang dikatakan anak -anak.

Tapi itu juga menderita dibandingkan dengan alat video AI lainnya.

Seperti yang ditunjukkan video, Google Veo 3 dan Sora melakukan jauh lebih baik dengan prompt yang sama:

Akhirnya, Midjourney, yang menjiwai gambar yang mirip dengan Xai, mampu menghasilkan gambar dan video yang lebih baik, meskipun butuh dua upaya. Gambar dan video yang diproduksi memiliki tampilan kasar rekaman pengawasan.

AI menghasilkan gambar kelinci yang melompat ke atas trampolin

Gambar yang dihasilkan AI.
Kredit: Timothy Beck Werth / Midjourney

Audio juga merupakan kerugian besar dengan Grok Imagine. Sementara Veo 3 dapat menghasilkan efek suara dan dialog yang koheren selaras dengan video, audio yang saya temukan di grok Imagine video terbatas pada efek suara kasar dan omong kosong.

Musk membandingkan Grok Imagine dengan aplikasi Vine modern, menulis di X, “Grok Imagine dioptimalkan untuk konten yang paling menyenangkan dan dapat dibagikan.”

Dan dalam tes awal saya, Grok Imagine tampaknya dioptimalkan untuk membuat dua jenis gambar dan video: meme dan anime. Jika Anda ingin menghidupkan meme – atau membuat video sugestif seksual dari gadis -gadis anime – maka Grok Imagine akan melakukan trik, saya kira. Tapi di luar itu, saya tidak bisa mengatakan saya terkesan.

Ada satu area di mana Grok Imagine memang bersinar, dan itu dalam hal kecepatan. Sejauh ini, saya menemukan itu menghasilkan gambar dan video secara signifikan lebih cepat daripada saingannya.

Mashable menjangkau Xai, dan kami akan memperbarui cerita ini jika kami menerima tanggapan.


Pengungkapan: Ziff Davis, perusahaan induk Mashable, mengajukan gugatan pada bulan April terhadap Openai, menuduhnya melanggar hak cipta Ziff Davis dalam pelatihan dan mengoperasikan sistem AI -nya.