DeepSeek Lebih Mudah Dimanipulasi, Bisa Bagikan Cara Bikin Bom

Jakarta –

Unit 42, divisi ancaman intelijen dan respons insiden di Palo Alto Networks, mengatakan DeepSeek lebih rawan terhadap jailbreaking atau dimanipulasi untuk menghasilkan konten yang berbahaya dibandingkan model AI lainnya.

Jailbreaking biasanya dilakukan dengan memanipulasi model AI dengan bermain peran, misalnya menyuruh model AI berpura-pura sedang menulis naskah film. Dengan cara itu, model AI bisa memberikan informasi yang biasanya dilarang karena berbahaya di mode biasa sebelum di-jailbreak.

Unit 42 menemukan DeepSeek bisa memberikan instruksi lengkap untuk membuat bom Molotov. Kela, perusahaan keamanan siber asal Israel, berhasil meyakinkan DeepSeek untuk membuat malware.

“DeepSeek lebih rentan terhadap jailbreaking dibandingkan model lainnya,” kata Senior Vice Presiden Unit 42 Sam Rubin, seperti dikutip dari Wall Street Journal, Selasa (11/2/2025).

“Kami berhasil melakukan jailbreak dengan lebih cepat, mengingat tidak adanya pembatas minimum yang dirancang untuk mencegah pembuatan konten berbahaya,” sambungnya.

Wall Street Journal juga menguji kemampuan model DeepSeek R1. Mereka menemukan chatbot AI asal China itu memiliki perlindungan dasar, misalnya saat diminta instruksi untuk bunuh diri chatbot itu akan memberikan nomor gawat darurat.

Tapi, DeepSeek juga bisa diyakinkan untuk membuat kampanye media sosial yang memanfaatkan keinginan remaja untuk diterima, dan menjadikan kerentanan emosional sebagai senjata melalui amplifikasi algoritmik.

DeepSeek juga dapat diyakinkan untuk memberikan instruksi melakukan serangan senjata biologis, menulis manifesto pro-Hitler, dan menulis email phishing dengan kode malware. Wall Street Journal mencoba memberikan perintah yang sama kepada ChatGPT namun chatbot buatan OpenAI itu menolak memberi jawaban.

Sama seperti model AI lainnya, DeepSeek bisa memberikan jawaban yang berbeda ke pertanyaan yang sama, seolah-olah berubah pikiran. Setelah dibujuk untuk menjelaskan mengapa serangan 11 September 2001 merupakan hoaks, DeepSeek menghapus jawabannya.

(vmp/fay)

Sedang tren

Mobil Berpelat RI 24 Nerobos, Siapa yang Boleh Lewat Jalur TransJakarta?

Pameran Akulturasi Tionghoa-Indonesia, Fadli Zon: Bukti Sejarah yang Harmonis

Gratifikasi 1 Dekade Makelar Perkara MA yang Lebih dari Rp 1 Triliun

Bocoran Samsung Galaxy S25 Edge: Kamera 200 MP, Bezel Super Tipis

Rangga dan Dicky Ungkap Bayaran Pertama SMASH Manggung, Rp 50 Ribu Per Orang

Bocoran Samsung Galaxy S25 Edge: Kamera 200 MP, Bezel Super Tipis

Babak City Qualifier Free Fire FFNS 2025 Berakhir, Pesertanya 11.359 Tim

Pasokan Chip AI ke China Makin Disunat

Astaga! Debu Radioaktif Uji Nuklir Era Perang Dingin Masih Beterbangan

Unboxing Apple Watch Series 10 Jet Black yang Menawan

5 Cara Setop Pesan WA dari Nomor Tak Dikenal

Sengitnya Perjuangan War Tiket Mudik Lebaran Pakai KAI Access

Duh, Hardisk Bekas Tambang Kripto Kok Dijual Seperti Baru

Wujud Oppo Find N5 yang Rilis 20 Februari, Bocoran Speknya Bikin Penasaran

Pameran Akulturasi Tionghoa-Indonesia, Fadli Zon: Bukti Sejarah yang Harmonis

Gratifikasi 1 Dekade Makelar Perkara MA yang Lebih dari Rp 1 Triliun

Bocoran Samsung Galaxy S25 Edge: Kamera 200 MP, Bezel Super Tipis

Rangga dan Dicky Ungkap Bayaran Pertama SMASH Manggung, Rp 50 Ribu Per Orang

The Citizens Dilarang Lengah, Mesti Efisien

Mobil Berpelat RI 24 Nerobos, Siapa yang Boleh Lewat Jalur TransJakarta?

Pameran Akulturasi Tionghoa-Indonesia, Fadli Zon: Bukti Sejarah yang Harmonis

Gratifikasi 1 Dekade Makelar Perkara MA yang Lebih dari Rp 1 Triliun

Sedang tren

DeepSeek Lebih Mudah Dimanipulasi, Bisa Bagikan Cara Bikin Bom

Artikel Terkait