AI Red Lines Initiative diluncurkan di Majelis Umum PBB Selasa - tempat yang sempurna untuk deklarasi yang sangat spesifik.
Lebih dari 200 Perairan Nobel dan pakar intelijen buatan lainnya (termasuk co-founder Openai Wojciech Zaremba), ditambah 70 organisasi yang menangani AI (termasuk Google DeepMind dan Antropik), menandatangani surat yang menyerukan “garis merah global untuk mencegah risiko AI yang tidak dapat diterima.” Namun, itu ditandai dengan apa yang tidak dikatakannya seperti apa yang dilakukannya.
“Sistem AI telah menunjukkan perilaku yang menipu dan berbahaya, namun sistem ini diberikan lebih banyak otonomi,” kata surat itu, meletakkan tenggat waktu 2026 untuk rekomendasinya diterapkan: “Perjanjian internasional tentang garis merah yang jelas dan dapat diverifikasi diperlukan untuk mencegah risiko yang tidak dapat diterima secara universal.”
Cukup adil, tapi Apa Garis merah, tepatnya? Surat itu hanya mengatakan bahwa parameter ini “harus dibangun dan menegakkan kerangka kerja global yang ada dan komitmen perusahaan sukarela, memastikan bahwa semua penyedia AI tingkat lanjut bertanggung jawab atas ambang batas bersama.”
Saya mencoba belajar dari tutor AI Anthropic. Saya merasa seperti kembali ke perguruan tinggi.
Kurangnya spesifik mungkin diperlukan untuk menyatukan koalisi penandatangan yang sangat longgar. Mereka termasuk AI alarmis seperti Geoffrey Hinton yang berusia 77 tahun, yang disebut “ayah baptis” yang telah menghabiskan tiga tahun terakhir memprediksi berbagai bentuk malapetaka dari kedatangan AGI yang akan datang (intelijen umum buatan); Daftar ini juga termasuk skeptis AI seperti ilmuwan kognitif Gary Marcus, yang telah menghabiskan tiga tahun terakhir memberi tahu kami bahwa AGI tidak datang dalam waktu dekat.
Apa yang bisa mereka semua setujui? Dalam hal ini, apa yang sudah bisa dilakukan pemerintah di AI, terutama AS dan Cina, sepakati, dan saling percaya untuk mengimplementasikannya? Pertanyaan bagus.
Kecepatan cahaya yang dapat dipasangkan
Tweet ini saat ini tidak tersedia. Mungkin dimuat atau telah dilepas.
Mungkin jawaban yang paling konkret oleh penandatangan datang dari Stuart Russell, profesor ilmu komputer veteran di UC Berkeley, setelah upaya sebelumnya untuk berbicara garis merah di KTT Keselamatan AI global 2023. Dalam sebuah makalah berjudul “Make AI aman atau buat AI yang aman?” Russell menulis bahwa perusahaan AI menawarkan “upaya sesudahnya untuk mengurangi perilaku yang tidak dapat diterima begitu sistem AI telah dibangun.” Dia membandingkan bahwa dengan pendekatan garis merah: memastikan keamanan bawaan dalam desain sejak awal, dan “perilaku yang tidak dapat diterima” tidak akan mungkin terjadi.
“Harus mungkin bagi pengembang untuk mengatakan, dengan keyakinan tinggi, bahwa sistem mereka tidak akan menunjukkan perilaku berbahaya,” tulis Russell. “Efek samping penting dari regulasi garis merah adalah secara substansial meningkatkan kemampuan rekayasa keselamatan pengembang.”
Dalam makalahnya, Russell mendapat sejauh empat contoh garis merah: sistem AI tidak boleh mencoba meniru diri mereka sendiri; Mereka tidak boleh mencoba masuk ke sistem komputer lain; Mereka seharusnya tidak diizinkan untuk memberikan instruksi tentang pembuatan bioweapon. Dan output mereka seharusnya tidak mengizinkan “pernyataan palsu dan berbahaya tentang orang sungguhan.”
Dari sudut pandang tahun 2025, kita dapat menambahkan garis merah yang menangani ancaman psikosis AI yang sedang berlangsung saat ini, dan chatbots AI yang diduga dapat dimanipulasi untuk memberikan nasihat tentang bunuh diri.
Kita semua bisa menyetujui itu, bukan?
Semua yang perlu Anda ketahui tentang AI Companions
Masalahnya adalah, Russell juga percaya bahwa tidak ada model bahasa besar (LLM) yang “mampu menunjukkan kepatuhan”, bahkan dengan empat persyaratan garis merah minimal. Mengapa? Karena mereka adalah mesin kata prediktif yang secara fundamental tidak mengerti apa yang mereka katakan. Mereka tidak mampu beralasan, bahkan pada teka -teki logika dasar, dan semakin “berhalucinate” jawaban untuk memuaskan penggunanya.
Begitu benar keselamatan garis merah AI, bisa dibilang, tidak ada model AI saat ini yang diizinkan di pasaran. Itu tidak mengganggu Russell; Seperti yang dia tunjukkan, kami tidak peduli bahwa kepatuhan itu sulit dalam hal kedokteran atau tenaga nuklir. Kami mengatur terlepas dari hasil.
Tetapi gagasan bahwa perusahaan AI hanya akan secara sukarela menutup model mereka sampai mereka dapat membuktikan kepada regulator bahwa tidak ada kerugian yang akan datang kepada pengguna? Ini adalah halusinasi yang lebih besar daripada apa pun yang bisa dihasilkan oleh chatgpt.
Topik
Kecerdasan buatan