
DeepSeek, perusahaan kecerdasan buatan (AI) asal China mengungkap biaya yang mereka habiskan untuk melatih model R1 jagoannya. Sesuai klaim sebelumnya, biaya melatih DeepSeek R1 jauh lebih rendah dibandingkan pesaing seperti ChatGPT,
Dalam artikel peer-review yang diterbitkan di jurnal akademik Nature, DeepSeek mengatakan mereka menghabiskan USD 294.000 atau sekitar Rp 4,8 miliar untuk melatih model R1. Artikel itu mencantumkan nama CEO dan pendiri DeepSeek Liang Wenfeng sebagai salah satu penulisnya.
Artikel itu juga mengungkap DeepSeek melatih model R1 menggunakan 512 unit chip Nvidia H800. Artikel versi sebelumnya yang diterbitkan pada Januari 2025 tidak memuat informasi ini.
SCROLL TO CONTINUE WITH CONTENT
Baca juga: Uni Emirat Arab Luncurkan AI Murah, Tantang ChatGPT dan DeepSeek |
Biaya pelatihan untuk large language model yang mengotaki chatbot AI merujuk pada biaya yang dikeluarkan untuk menjalankan sekumpulan chip canggih selama berbulan-bulan guna memproses teks dan kode dalam jumlah besar.
Proses pelatihan AI biasanya membutuhkan biaya yang sangat besar. Pada tahun 2023, CEO OpenAI Sam Altman mengatakan pelatihan model yang mendasari ChatGPT membutuhkan lebih dari USD 100 juta atau sekitar Rp 1,6 triliun.
Sejumlah pernyataan DeepSeek tentang biaya dan teknologi yang digunakan untuk melatih model AI-nya diragukan oleh pejabat dan perusahaan Amerika Serikat.
Chip H800 yang dipakai melatih model R1 dirancang khusus oleh Nvidia untuk pasar China setelah pemerintah AS melarang raksasa chip itu mengekspor GPU AI H100 dan A100 yang lebih bertenaga ke China.
Pada bulan Juni lalu, petinggi AS mengatakan DeepSeek memiliki chip H100 dalam jumlah besar yang diperoleh setelah larangan ekspor diberlakukan pada Oktober 2022. Nvidia saat itu mengatakan DeepSeek menggunakan chip H800 yang didapatkan secara legal, bukan chip H100.
Baca juga: DeepSeek V3.1 Resmi Hadir: Apa Saja Fitur Terbaru dan Peningkatannya? |
Dalam dokumen pendukung yang menyertai artikel Nature, DeepSek untuk pertama kalinya mengakui memiliki chip A100 yang dipakai untuk tahap persiapan pengembangan model R1. Setelah fase awal ini, model R1 dilatih menggunakan chip H800 selama 80 jam.
"Mengenai penelitian kami terkait DeepSeek-R1, kami menggunakan GPU A100 untuk mempersiapkan eksperimen dengan model yang lebih kecil," tulis peneliti DeepSeek, seperti dikutip dari Reuters, Minggu (21/9/2025).

Video: Korea Selatan Blokir Aplikasi DeepSeek

Video: Korea Selatan Blokir Aplikasi DeepSeek
(vmp/fay)
Được in lại từ detik_id, bản quyền được giữ lại bởi tác giả gốc.
Tuyên bố miễn trừ trách nhiệm: Quan điểm được trình bày hoàn toàn là của tác giả và không đại diện cho quan điểm chính thức của Followme. Followme không chịu trách nhiệm về tính chính xác, đầy đủ hoặc độ tin cậy của thông tin được cung cấp và không chịu trách nhiệm cho bất kỳ hành động nào được thực hiện dựa trên nội dung, trừ khi được nêu rõ bằng văn bản.
Tải thất bại ()