
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Cerebras Systems mengumumkan hari ini akan menjadi tuan rumah model intelijen buatan R1 Deepseek di server AS, menjanjikan kecepatan hingga 57 kali lebih cepat daripada solusi berbasis GPU sambil menyimpan data sensitif di dalam perbatasan Amerika. Langkah ini dilakukan di tengah kekhawatiran yang semakin besar tentang kemajuan AI dan privasi data China yang cepat.
Startup chip AI akan menggunakan versi 70 miliar parameter dari Deepseek-R1 yang berjalan pada perangkat keras berskala wafer eksklusifnya, memberikan 1.600 token per detik-peningkatan dramatis atas implementasi GPU tradisional yang telah berjuang dengan model AI “penalaran” yang lebih baru.
Mengapa Model Penalaran Deepseek Membentuk kembali perusahaan AI
“Model penalaran ini mempengaruhi ekonomi,” kata James Wang, seorang eksekutif senior di Cerbras, dalam sebuah wawancara eksklusif dengan VentureBeat. “Setiap pekerja pengetahuan pada dasarnya harus melakukan semacam tugas kognitif multi-langkah. Dan model penalaran ini akan menjadi alat yang memasuki alur kerja mereka. “
Pengumuman ini mengikuti minggu yang penuh gejolak di mana kemunculan Deepseek memicu kerugian nilai pasar terbesar di Nvidia, hampir $ 600 miliar, menimbulkan pertanyaan tentang supremasi AI raksasa chip. Solusi cerebras secara langsung membahas dua masalah utama yang telah muncul: tuntutan komputasi model AI canggih, dan kedaulatan data.
“Jika Anda menggunakan API Deepseek, yang sangat populer saat ini, data itu dikirim langsung ke Cina,” Wang menjelaskan. “Itu adalah satu peringatan yang parah itu [makes] banyak perusahaan dan perusahaan AS… tidak mau mempertimbangkan [it]. “

Bagaimana Teknologi Skala Wafer Cerebras mengalahkan GPU tradisional dengan kecepatan AI
Cerebras mencapai keunggulan kecepatannya melalui arsitektur chip baru yang menjaga seluruh model AI pada prosesor berukuran wafer tunggal, menghilangkan hambatan memori yang mengganggu sistem berbasis GPU. Perusahaan mengklaim implementasi kecocokan Deepseek-R1 atau melebihi kinerja model kepemilikan Openai, sambil berjalan sepenuhnya di tanah AS.
Perkembangan ini merupakan perubahan signifikan dalam lanskap AI. Deepseek, yang didirikan oleh mantan eksekutif Hedge Fund Liang Wenfeng, mengejutkan industri ini dengan mencapai kemampuan penalaran AI yang canggih dilaporkan hanya 1% dari biaya pesaing AS. Solusi hosting cerebras sekarang menawarkan perusahaan Amerika cara untuk memanfaatkan kemajuan ini sambil mempertahankan kontrol data.
“Ini sebenarnya adalah kisah yang bagus bahwa laboratorium penelitian AS memberikan hadiah ini kepada dunia. Orang Cina mengambilnya dan memperbaikinya, tetapi memiliki keterbatasan karena berjalan di Cina, memiliki beberapa masalah sensor, dan sekarang kami mengambilnya kembali dan menjalankannya di pusat data AS, tanpa sensor, tanpa retensi data, ”kata Wang.

Kepemimpinan teknologi AS menghadapi pertanyaan baru saat AI Innovation Goes Global
Layanan ini akan tersedia melalui pratinjau pengembang mulai hari ini. Meskipun pada awalnya akan gratis, serebras berencana untuk mengimplementasikan kontrol akses API karena permintaan awal yang kuat.
Langkah ini terjadi ketika anggota parlemen AS bergulat dengan implikasi kenaikan Deepseek, yang telah mengekspos batasan potensial dalam pembatasan perdagangan Amerika yang dirancang untuk mempertahankan keunggulan teknologi dibandingkan Cina. Kemampuan perusahaan Cina untuk mencapai kemampuan AI terobosan meskipun kontrol ekspor chip telah memicu panggilan untuk pendekatan peraturan baru.
Analis industri menyarankan perkembangan ini dapat mempercepat pergeseran dari infrastruktur AI yang bergantung pada GPU. “Nvidia tidak lagi menjadi pemimpin dalam kinerja inferensi,” kata Wang, menunjuk pada tolok ukur yang menunjukkan kinerja yang unggul dari berbagai chip AI khusus. “Perusahaan chip AI lainnya ini benar -benar lebih cepat dari GPU untuk menjalankan model terbaru ini.”
Dampaknya melampaui metrik teknis. Karena model AI semakin menggabungkan kemampuan penalaran yang canggih, tuntutan komputasi mereka telah meroket. Cerebras berpendapat bahwa arsitekturnya lebih cocok untuk beban kerja yang muncul ini, berpotensi membentuk kembali lanskap kompetitif dalam penyebaran AI perusahaan.