
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Hanya seminggu yang lalu-pada 20 Januari 2025-Startup AI Cina Deepseek melepaskan model AI sumber terbuka baru yang disebut R1 yang mungkin awalnya keliru untuk salah satu massa yang terus tumbuh dari saingan yang hampir dapat dipertukarkan yang telah bermunculan sejak Openai Debutnya chatgpt (didukung oleh model GPT-3.5 sendiri, pada awalnya) lebih dari dua tahun yang lalu.
But that quickly proved unfounded, as DeepSeek's mobile app has in that short time rocketed up the charts of the Apple App Store in the US to dethrone ChatGPT for the number one spot and caused a massive market correction as investors dumped stock in formerly hot computer chip Pembuat seperti NVIDIA, yang unit pemrosesan grafisnya (GPU) telah diminta tinggi untuk digunakan dalam superclusters besar -besaran untuk melatih model AI baru dan melayani mereka kepada pelanggan secara berkelanjutan (modalitas yang dikenal sebagai “inferensi.”)
Venture capitalist Marc Andreessen, echoing sentiments of other tech workers, wrote on the social network X last night: “Deepseek R1 is AI's Sputnik moment,” comparing it to the pivotal October 1957 launch of the first artificial satellite in history, Sputnik 1, by Uni Soviet, yang memicu “perlombaan luar angkasa” antara negara itu dan AS untuk mendominasi perjalanan ruang angkasa.
Peluncuran Sputnik menggembleng AS untuk berinvestasi besar -besaran dalam penelitian dan pengembangan pesawat ruang angkasa dan roket. Meskipun ini bukan analogi yang sempurna-investasi besar tidak diperlukan untuk menciptakan Deepseek-R1, justru sebaliknya (lebih lanjut tentang ini di bawah)-tampaknya menandakan titik balik utama di pasar AI global, seperti untuk pertama kalinya, sebuah Produk AI dari Cina telah menjadi yang paling populer di dunia.
Tapi sebelum kita melompat di kereta hype Deepseek, mari kita mundur dan memeriksa kenyataan. Sebagai seseorang yang telah secara luas menggunakan chatgpt Openai-baik di platform web dan seluler-dan mengikuti kemajuan AI dengan cermat, saya percaya bahwa sementara pencapaian Deepseek-R1 patut diperhatikan, ini bukan saatnya untuk mengabaikan chatgpt atau investasi AI AS. Dan harap dicatat, saya tidak dibayar oleh Openai untuk mengatakan ini – saya tidak pernah mengambil uang dari perusahaan dan tidak merencanakannya.
Apa yang dilakukan Deepseek-R1 dengan baik
Deepseek-R1 adalah bagian dari generasi baru model “penalaran” besar yang melakukan lebih dari menjawab pertanyaan pengguna: mereka merefleksikan analisis mereka sendiri saat mereka menghasilkan respons, berusaha menangkap kesalahan sebelum melayani mereka kepada pengguna.
Dan Deepseek-R1 mencocokkan atau melampaui model penalaran Openai sendiri, O1, dirilis pada bulan September 2024 pada awalnya hanya untuk pengguna chatgpt plus dan pro berlangganan, di beberapa area.
Misalnya, pada tolok ukur Math-500, yang menilai pemecahan masalah matematika tingkat tinggi, Deepseek-R1 mencapai tingkat akurasi 97,3%, sedikit mengungguli OpenAI O1 96,4%. Dalam hal kemampuan pengkodean, Deepseek-R1 mencetak 49,2% pada tolok ukur terverifikasi SWE-Bench, menyingkirkan Openai O1 48,9%.
Selain itu, secara finansial, Deepseek-R1 menawarkan penghematan biaya yang substansial. Model ini dikembangkan dengan investasi di bawah $ 6 juta, sebagian kecil dari pengeluaran – diperkirakan beberapa miliar – dilaporkan terkait dengan model pelatihan seperti Openai's O1.
Deepseek pada dasarnya dipaksa untuk menjadi lebih efisien dengan GPU yang langka dan lebih tua berkat pembatasan ekspor AS pada penjualan teknologi ke China. Selain itu, Deepseek menyediakan akses API pada $ 0,14 per juta token, secara signifikan meremehkan tarif Openai sebesar $ 7,50 per juta token.
Keuntungan efisiensi besar-besaran Deepseek-R1, penghematan biaya, dan kinerja yang setara dengan model AI AS teratas telah menyebabkan Lembah Silikon dan komunitas bisnis yang lebih luas untuk panik tentang apa yang tampaknya merupakan kenaikan total pasar AI, geopolitik, dan ekonomi AI yang dikenal pelatihan model.
Sementara keuntungan Deepseek revolusioner, pendulum berayun terlalu jauh ke arahnya sekarang
Tidak dapat disangkal bahwa efektivitas biaya Deepseek-R1 adalah pencapaian yang signifikan. Tapi jangan lupa bahwa Deepseek sendiri berutang banyak keberhasilannya kepada kami inovasi AI, kembali ke arsitektur transformator 2017 awal yang dikembangkan oleh peneliti Google AI (yang memulai seluruh kegilaan LLM).
Deepseek-R1 dilatih tentang pertanyaan dan jawaban data sintetis dan secara khusus, menurut makalah yang dirilis oleh para peneliti, pada “dataset Deepseek-V3 yang disesuaikan dengan baik,” model sebelumnya (tidak masuk akal), yang ditemukan, yang ditemukan, yang ditemukan, yang ditemukan, yang ditemukan, yang tidak masuk Untuk memiliki banyak indikator dihasilkan dengan model GPT-4O Openai itu sendiri!
Tampaknya cukup jelas untuk mengatakan bahwa tanpa GPT-4O untuk menyediakan data ini, dan tanpa rilis Openai sendiri dari model penalaran komersial pertama O1 pada bulan September 2024, yang menciptakan kategori, Deepseek-R1 hampir pasti tidak akan ada.
Selain itu, keberhasilan Openai membutuhkan sumber daya GPU dalam jumlah besar, membuka jalan bagi terobosan yang tidak diragukan lagi diuntungkan oleh Deepseek. Investor Panic saat ini tentang perusahaan chip dan AI terasa prematur dan berlebihan.
Kemampuan visi dan pembuatan gambar ChatGPT masih sangat penting dan berharga di tempat kerja dan pengaturan pribadi-Deepseek-R1 belum memilikinya
Sementara Deepseek-R1 telah terkesan dengan penalaran “rantai pemikiran” yang terlihat-semacam aliran kesadaran di mana model menampilkan teks saat menganalisis prompt pengguna dan berusaha untuk menjawabnya-dan efisiensi dalam alur kerja berbasis teks dan matematika, Ini tidak memiliki beberapa fitur yang membuat chatgpt alat yang lebih kuat dan serbaguna hari ini.
Tidak ada generasi gambar atau kemampuan visi
Situs web dan aplikasi seluler Deepseek-R1 resmi memang membiarkan pengguna mengunggah foto dan lampiran file. Tapi, mereka hanya dapat mengekstraksi teks dari mereka menggunakan Optical Character Recognition (OCR), salah satu teknologi komputasi paling awal (berasal dari tahun 1959).
Ini basa jika dibandingkan dengan kemampuan visi ChatGPT. Seorang pengguna dapat mengunggah gambar tanpa teks apa pun dan meminta chatgpt menganalisis gambar, menggambarkannya, atau memberikan informasi lebih lanjut berdasarkan apa yang dilihatnya dan permintaan teks pengguna.
ChatGPT memungkinkan pengguna untuk mengunggah foto dan dapat menganalisis materi visual dan memberikan wawasan terperinci atau saran yang dapat ditindaklanjuti. Misalnya, ketika saya membutuhkan panduan untuk memperbaiki sepeda saya atau memelihara unit pendingin udara saya, kemampuan chatgpt untuk memproses gambar terbukti sangat berharga. Deepseek-R1 belum bisa melakukan ini. Lihat di bawah untuk perbandingan visual:

Tidak ada pembuatan gambar
Tidak adanya kemampuan gambar generatif adalah batasan utama lainnya. Sebagai seseorang yang sering menghasilkan gambar AI menggunakan chatgpt (seperti untuk header artikel ini sendiri) yang ditenagai oleh model Dall · E 3 yang mendasari Openai, kemampuan untuk membuat gambar yang terperinci dan bergaya dengan chatgpt adalah pengubah permainan.
Fitur ini sangat penting untuk banyak alur kerja kreatif dan profesional, dan Deepseek belum menunjukkan fungsionalitas yang sebanding, meskipun saat ini perusahaan merilis model visi open-source, Janus Pro, yang katanya mengungguli Dall · E 3, difusi stabil 3 dan lainnya Model pembuatan gambar yang terkemuka di industri pada tolok ukur pihak ketiga.
Tidak ada mode suara
Deepseek-R1 juga tidak memiliki mode interaksi suara, fitur yang telah menjadi semakin penting untuk aksesibilitas dan kenyamanan. Mode suara ChatGPT memungkinkan interaksi alami dan percakapan, menjadikannya pilihan yang unggul untuk penggunaan hands-free atau untuk pengguna dengan kebutuhan aksesibilitas yang berbeda.
Bersemangat untuk potensi masa depan Deepseek – tetapi juga waspada terhadap tantangannya
Ya, Deepseek-R1 dapat-dan kemungkinan akan-menambahkan kemampuan suara dan visi di masa depan. Tapi melakukannya bukanlah hal kecil.
Mengintegrasikan pembuatan gambar, analisis visi, dan kemampuan suara membutuhkan sumber daya pengembangan yang substansial dan, ironisnya, banyak dari GPU kinerja tinggi yang sama dengan yang sekarang dinyatakan oleh investor. Menyebarkan fitur-fitur ini secara efektif dan dengan cara yang ramah pengguna adalah tantangan lain sepenuhnya.
Prestasi Deepseek-R1 sangat mengesankan dan menandakan perubahan yang menjanjikan dalam lanskap AI global. Namun, sangat penting untuk menjaga kegembiraan tetap terkendali. Untuk saat ini, ChatGPT tetap menjadi produk yang lebih baik dan lebih mampu, menawarkan rangkaian fitur yang tidak bisa ditandingi oleh Deepseek. Mari kita hargai kemajuan sambil mengakui keterbatasan dan pentingnya inovasi dan investasi AS.