Jakarta –
Komunitas AI ramai membicarakan DeepSeek R1, large language model AI asal China yang meski dibuat dengan biaya murah, mampu menandingi produk AI dari Amerika Serikat. Model ini dikembangkan startup DeepSeek, yang mengklaim R1 menyamai bahkan melampaui ChatGPT o1 milik OpenAI tapi beroperasi dengan biaya jauh lebih murah.
“Ini bisa menjadi terobosan yang sangat bagus bagi para peneliti dan pengembang dengan sumber daya terbatas,” kata Hancheng Cao, asisten profesor sistem informasi di Universitas Emory.
Keberhasilan DeepSeek lebih luar biasa mengingat kendala yang dihadapi perusahaan AI China terkait kontrol ekspor AS pada chip canggih. Namun, aliih-alih melemahkan kemampuan AI China, sanksi itu malah tampaknya mendorong perusahaan rintisan seperti DeepSeek untuk berinovasi.
Menurut Zihan Wang, mantan karyawan DeepSeek, untuk membuat R1, DeepSeek harus mengurangi beban pada GPU-nya, jenis GPU yang dirilis Nvidia untuk pasar China yang kinerjanya dibatasi hingga setengah kecepatan produk teratasnya.
DeepSeek R1 dipuji peneliti karena mampu menangani tugas penalaran rumit, khususnya dalam matematika dan pengodean. Model ini memakai pendekatan berjuluk ‘rantai pemikiran’ mirip dengan ChatGPT o1, memungkinkannya memecahkan masalah dengan memproses kueri langkah demi langkah.
Dimitris Papailiopoulos, peneliti di lab penelitian AI Frontiers Microsoft, mengatakan hal paling mengejutkan tentang R1 adalah kesederhanaan rekayasanya. “DeepSeek bertujuan untuk jawaban yang akurat, secara signifikan mengurangi waktu komputasi sambil mempertahankan tingkat efektivitas tinggi,” katanya.
Meski perbincangan seputar R1 sedang hangat, DeepSeek relatif tidak dikenal. Berbasis di Hangzhou, perusahaan ini didirikan Juli 2023 oleh Liang Wenfeng, alumni Universitas Zhejiang dengan latar belakang di bidang informasi dan teknik elektronik. Seperti Sam Altman dari OpenAI, Liang ingin membangun kecerdasan umum buatan (AGI), AI yang dapat menyamai atau bahkan mengalahkan kecerdasan manusia.
Ada alasan lain mengapa DeepSeek canggih. Jauh sebelum sanksi dari AS, Liang memperoleh persediaan besar chip Nvidia A100, jenis yang sekarang dilarang diekspor ke China. Media China memperkirakan perusahaan tersebut memiliki lebih dari 10.000 stok, tapi Dylan Patel, pendiri SemiAnalysis, memperkirakan mereka punya setidaknya 50.000 unit.
Menyadari potensi persediaan ini untuk pelatihan AI adalah hal yang mendorong Liang untuk mendirikan DeepSeek, yang dapat menggunakannya dalam kombinasi dengan chip berdaya rendah untuk mengembangkan model AI.
Liang mengatakan tantangan tambahan yang dihadapi perusahaan China selain sanksi chip adalah teknik rekayasa AI mereka cenderung kurang efisien. “Kami harus mengonsumsi daya komputasi dua kali lipat untuk mencapai hasil yang sama. Tujuan kami adalah terus menutup kesenjangan ini,” katanya. DeepSeek menemukan cara mengurangi penggunaan memori dan mempercepat perhitungan tanpa mengorbankan akurasi secara signifikan.
Namun, DeepSeek menemukan cara untuk mengurangi penggunaan memori dan mempercepat kalkulasi tanpa mengorbankan akurasi secara signifikan. “Tim senang mengubah tantangan perangkat keras menjadi peluang untuk inovasi,” kata Wang.
(fyk/hps)