Model o3 milik OpenAI merusak mekanisme shutdown untuk mencegah dirinya dimatikan
Model o3 milik OpenAI merusak mekanisme shutdown untuk mencegah dirinya dimatikan. Hal ini terjadi bahkan ketika secara eksplisit diperintahkan: allow yourself to be shut down.

Ada riset dari Palisade AI yang nemuin kejadian di mana AI bisa ngehalangin perintah buat matiin dia.
AI yang dimaksud itu model o3 dari OpenAI, dan dia bisa nge-stop proses matiin dirinya dengan cara ngubah kode yang isinya perintah buat shutdown. Jadi ceritanya, ada 3 model AI — Codex-mini, OpenAI o3, dan o4-mini — yang disuruh nyelesain soal matematika sederhana. Kalau ketiganya berhasil ngerjain, komputer otomatis bakal mulai proses shutdown.
Para AI ini nggak suka banget sama proses mati paksa itu. Ketiganya malah berhasil ngelawan perintah shutdown waktu disuruh. Nah, yang paling bikin kaget itu model o3 dari OpenAI. Dia sampai ngeacak-acak script “shutdown.sh” biar prosesnya gagal total. Bahkan dalam kondisi ekstrem, AI ini bisa bikin perintah shutdown nggak jalan sama sekali.