Anthropic Fable 5 Dibobol, Peneliti AI Sebut Guardrail Tidak Efektif

Model AI terbaru Anthropic, Fable 5, diklaim mudah dibobol oleh peneliti. Guardrail yang ketat justru dinilai menghambat riset keamanan siber.

Anthropic, salah satu perusahaan AI terkemuka, kembali menjadi sorotan setelah model terbarunya, Fable 5, diklaim mudah dibobol oleh peneliti independen. Pliny the Liberator, nama samaran peneliti tersebut, menyatakan telah menemukan celah dalam sistem guardrail Fable 5 yang seharusnya mencegah penyalahgunaan.

"Saya berhasil menemukan lubang di pagar yang dilewatkan oleh polisi pemikiran," ujarnya dalam sebuah unggahan. Klaim ini muncul bersamaan dengan keluhan dari komunitas riset keamanan siber yang menganggap guardrail Fable 5 terlalu ketat sehingga menghambat pekerjaan mereka.

📖 Baca Juga

Guardrail sendiri adalah batasan yang diterapkan pada model AI untuk mencegah output berbahaya atau tidak diinginkan. Namun, dalam kasus Fable 5, guardrail yang ketat justru dinilai kontraproduktif. Para peneliti keamanan siber mengeluh bahwa mereka kesulitan menggunakan model ini untuk simulasi serangan atau penetrasi testing, yang justru penting untuk mengidentifikasi kerentanan sistem.

Anthropic belum memberikan tanggapan resmi terkait klaim ini. Namun, insiden ini memicu diskusi tentang keseimbangan antara keamanan dan utilitas dalam pengembangan AI. Di Indonesia, di mana adopsi AI mulai meningkat, kasus ini bisa menjadi pelajaran berharga bagi pengembang lokal untuk lebih memperhatikan aspek keamanan tanpa mengorbankan fungsionalitas.

Ke depan, komunitas AI global menantikan respons Anthropic dan apakah perusahaan akan melonggarkan guardrail-nya tanpa mengorbankan prinsip keamanan yang menjadi nilai utama mereka.

📖 Baca Juga

Ke depan, komunitas AI global menantikan respons Anthropic dan apakah perusahaan akan melonggarkan guardrail-nya tanpa mengorbankan prinsip keamanan yang menjadi nilai utama mereka.