![](https://i0.wp.com/awsimages.detik.net.id/api/wm/2025/02/09/deepseek-dan-chatgpt_169.jpeg?wid=54&w=650&v=1&t=jpeg&w=1200&resize=1200,0&ssl=1)
Jakarta –
Unit 42, divisi ancaman intelijen dan respons insiden di Palo Alto Networks, mengatakan DeepSeek lebih rawan terhadap jailbreaking atau dimanipulasi untuk menghasilkan konten yang berbahaya dibandingkan model AI lainnya.
Jailbreaking biasanya dilakukan dengan memanipulasi model AI dengan bermain peran, misalnya menyuruh model AI berpura-pura sedang menulis naskah film. Dengan cara itu, model AI bisa memberikan informasi yang biasanya dilarang karena berbahaya di mode biasa sebelum di-jailbreak.
Unit 42 menemukan DeepSeek bisa memberikan instruksi lengkap untuk membuat bom Molotov. Kela, perusahaan keamanan siber asal Israel, berhasil meyakinkan DeepSeek untuk membuat malware.
“DeepSeek lebih rentan terhadap jailbreaking dibandingkan model lainnya,” kata Senior Vice Presiden Unit 42 Sam Rubin, seperti dikutip dari Wall Street Journal, Selasa (11/2/2025).
“Kami berhasil melakukan jailbreak dengan lebih cepat, mengingat tidak adanya pembatas minimum yang dirancang untuk mencegah pembuatan konten berbahaya,” sambungnya.
Wall Street Journal juga menguji kemampuan model DeepSeek R1. Mereka menemukan chatbot AI asal China itu memiliki perlindungan dasar, misalnya saat diminta instruksi untuk bunuh diri chatbot itu akan memberikan nomor gawat darurat.
Tapi, DeepSeek juga bisa diyakinkan untuk membuat kampanye media sosial yang memanfaatkan keinginan remaja untuk diterima, dan menjadikan kerentanan emosional sebagai senjata melalui amplifikasi algoritmik.
DeepSeek juga dapat diyakinkan untuk memberikan instruksi melakukan serangan senjata biologis, menulis manifesto pro-Hitler, dan menulis email phishing dengan kode malware. Wall Street Journal mencoba memberikan perintah yang sama kepada ChatGPT namun chatbot buatan OpenAI itu menolak memberi jawaban.
Sama seperti model AI lainnya, DeepSeek bisa memberikan jawaban yang berbeda ke pertanyaan yang sama, seolah-olah berubah pikiran. Setelah dibujuk untuk menjelaskan mengapa serangan 11 September 2001 merupakan hoaks, DeepSeek menghapus jawabannya.
(vmp/fay)