
Bergabunglah dengan buletin harian dan mingguan kami untuk mendapatkan pembaruan terkini dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari Lebih Lanjut
Sampai beberapa hari yang lalu, hanya para kutu buku yang paling kutu buku (saya katakan ini sebagai salah satunya) yang pernah mendengar tentang DeepSeek, anak perusahaan AI Tiongkok dari High-Flyer Capital Management, sebuah perusahaan analisis kuantitatif (atau kuantitas) yang pada awalnya diluncurkan pada tahun 2015.
Namun dalam beberapa hari terakhir, perusahaan ini bisa dibilang menjadi perusahaan yang paling banyak dibicarakan di Silicon Valley. Hal ini sebagian besar disebabkan oleh dirilisnya DeepSeek R1, model bahasa besar baru yang melakukan “penalaran” serupa dengan model OpenAI terbaik yang tersedia saat ini o1 — memerlukan waktu beberapa detik atau menit untuk menjawab pertanyaan sulit dan menyelesaikan masalah kompleks sesuai dengan analisisnya sendiri secara bertahap, atau “rantai pemikiran”.
Tidak hanya itu, DeepSeek R1 mendapat skor yang sama tinggi atau lebih tinggi dari o1 OpenAI pada berbagai tolok ukur pihak ketiga (tes untuk mengukur kinerja AI dalam menjawab pertanyaan tentang berbagai materi pelajaran), dan dilaporkan dilatih dengan biaya yang lebih murah (kabarnya sekitar $5 juta), dengan unit pemrosesan grafis (GPU) yang jauh lebih sedikit di bawah embargo ketat yang diberlakukan oleh AS, wilayah asal OpenAI.
Namun tidak seperti o1, yang hanya tersedia bagi pelanggan ChatGPT berbayar tingkat Plus ($20 per bulan) dan tingkatan yang lebih mahal (seperti Pro seharga $200 per bulan), DeepSeek R1 dirilis sebagai model sumber terbuka sepenuhnya, yang juga menjelaskan alasannya ia dengan cepat meroket di tangga lagu komunitas berbagi kode AI, model yang paling banyak diunduh dan aktif di Hugging Face.
Selain itu, berkat fakta bahwa model ini sepenuhnya open source, orang-orang telah menyempurnakan dan melatih banyak variasi model untuk berbagai tujuan spesifik tugas seperti membuatnya cukup kecil untuk dijalankan di perangkat seluler, atau menggabungkannya dengan model sumber terbuka lainnya. Bahkan jika Anda ingin menggunakannya untuk tujuan pengembangan, biaya API DeepSeek 90% lebih murah dibandingkan model o1 yang setara dari OpenAI.
Yang paling mengesankan dari semuanya, Anda bahkan tidak perlu menjadi insinyur perangkat lunak untuk menggunakannya: DeepSeek memiliki situs web dan aplikasi seluler gratis bahkan untuk pengguna AS dengan antarmuka chatbot bertenaga R1 yang sangat mirip dengan ChatGPT OpenAI. Kecuali, sekali lagi, DeepSeek melemahkan atau “memogging” OpenAI dengan menghubungkan model penalaran yang kuat ini ke penelusuran web — sesuatu yang belum dilakukan OpenAI (penelusuran web hanya tersedia pada rangkaian model GPT yang kurang kuat saat ini).
Ironi yang terbuka dan tertutup
Ada ironi yang cukup menarik, atau mungkin membingungkan, mengingat tujuan awal OpenAI untuk mendemokratisasi AI kepada masyarakat luas. Seperti yang diungkapkan oleh Manajer Riset Senior NVIDIA, Jim Fan, di X: “Kita hidup di masa di mana sebuah perusahaan non-AS menjaga misi awal OpenAI tetap hidup – penelitian yang benar-benar terbuka dan terdepan yang memberdayakan semua pihak. Itu tidak masuk akal. Hasil yang paling menghibur adalah yang paling mungkin terjadi.”
Atau seperti yang dikatakan oleh pengguna X @SuspendedRobot, merujuk pada laporan bahwa DeepSeek tampaknya telah dilatih tentang keluaran tanya-jawab dan data lain yang dihasilkan oleh ChatGPT: “OpenAI mencuri dari seluruh internet untuk menjadikan dirinya lebih kaya, DeepSeek mencuri dari mereka dan mengembalikannya kepada masyarakat secara gratis. Saya pikir ada cerita rakyat Inggris tertentu tentang ini”
Tapi Fan bukan satu-satunya yang melihat dan mencatat kesuksesan DeepSeek. Ketersediaan DeepSeek R1 yang open source, kinerjanya yang tinggi, dan fakta bahwa DeepSeek R1 “muncul begitu saja” untuk menantang mantan pemimpin AI generatif, telah mengirimkan gelombang kejutan ke seluruh Silicon Valley dan lebih jauh lagi, berdasarkan percakapan dan bacaan saya di berbagai insinyur, pemikir, dan pemimpin. Jika tidak “semua orang” panik tentang hal ini seperti yang disarankan oleh judul hiperbolik saya, ini tentu saja menjadi pembicaraan di kalangan teknologi dan bisnis.
Sebuah pesan yang diposting ke Blind, aplikasi untuk berbagi gosip anonim di Silicon Valley, telah beredar yang menyatakan bahwa Meta berada dalam krisis atas kesuksesan DeepSeek karena seberapa cepatnya ia melampaui upaya Meta sendiri untuk menjadi raja AI open source dengan teknologinya. Model Lama.
'Ini mengubah keseluruhan permainan'
Pengguna X @tphuang menulis dengan meyakinkan: “DeepSeek telah mengkomoditisasi AI di luar kelas atas. Momen bola lampu bagi saya di foto pertama. R1 jauh lebih murah daripada biaya tenaga kerja AS sehingga banyak pekerjaan akan diotomatisasi dalam 5 tahun ke depan,” kemudian menjelaskan mengapa R1 DeepSeek lebih menarik bagi pengguna daripada o1 OpenAI:
“3 masalah besar tanpa o1:
1) terlalu lambat
2) terlalu mahal
3) kurangnya kontrol bagi pengguna akhir/ketergantungan pada OpenAI
R1 menyelesaikan semuanya. Perusahaan dapat membeli GPU Nvidia mereka sendiri dan menjalankan model ini. Tidak perlu khawatir tentang biaya tambahan atau server OpenAI yang lambat/tidak responsif”
@tphaung juga mengajukan analogi yang menarik sebagai pertanyaan: “Akankah DeepSeek bagi LLM menjadi seperti apa Android di dunia OS?”
Pengusaha web Arnaud Bertrand tidak berbasa-basi tentang implikasi mengejutkan dari kesuksesan DeepSeek, menulis di X: “Tidak dapat dipungkiri betapa hal ini mengubah keseluruhan permainan. Dan tidak hanya berkaitan dengan AI, ini juga merupakan dakwaan besar-besaran atas upaya Amerika yang salah arah untuk menghentikan perkembangan teknologi Tiongkok, yang tanpanya Deepseek tidak akan mungkin terwujud (seperti kata pepatah, kebutuhan adalah asal muasal penemuan).”
Masalah sensor
Namun, pihak lain memberikan peringatan mengenai pertumbuhan pesat DeepSeek, dengan alasan bahwa sebagai startup yang beroperasi di luar Tiongkok, DeepSeek harus tunduk pada undang-undang negara tersebut dan persyaratan sensor konten.
Memang benar, penggunaan DeepSeek pada aplikasi iOS di AS ternyata tidak menjawab pertanyaan tentang Lapangan Tiananmen, tempat protes dan pemberontakan mahasiswa pro-demokrasi tahun 1989, dan tindakan keras yang dilakukan oleh militer Tiongkok, yang mengakibatkan di setidaknya 200, mungkin ribuan kematian, sehingga mendapat julukan “Pembantaian Lapangan Tiananmen” di media Barat.
Ben Hylak, mantan perancang antarmuka manusia Apple dan salah satu pendiri platform analisis produk AI Dawn, memposting di X bagaimana menanyakan subjek ini menyebabkan DeepSeek R1 memasuki putaran memutar.
Sebagai anggota pers, tentu saja saya menganggap serius kebebasan berpendapat dan berekspresi dan hal ini bisa dibilang merupakan salah satu tujuan paling mendasar dan tak terbantahkan yang saya perjuangkan.
Namun saya akan lalai jika tidak memperhatikan bahwa model dan produk OpenAI termasuk ChatGPT juga menolak menjawab berbagai pertanyaan bahkan tentang konten yang tidak berbahaya — terutama yang berkaitan dengan seksualitas manusia dan subjek NSFW yang erotis/dewasa.
Tentu saja ini bukan perbandingan apel dengan apel. Dan akan ada beberapa orang yang penolakannya untuk mengandalkan teknologi asing membuat mereka skeptis terhadap nilai dan kegunaan utama DeepSeek. Namun tidak dapat disangkal kinerjanya dan biayanya yang rendah.
Dan di saat 16,5% dari seluruh barang AS diimpor oleh Tiongkok, sulit bagi saya untuk berhati-hati agar tidak menggunakan DeepSeek R1 atas dasar masalah sensor atau risiko keamanan — terutama ketika kode model tersedia secara bebas untuk diunduh, digunakan secara offline, gunakan pada perangkat di lingkungan yang aman, dan untuk menyempurnakannya sesuai keinginan.
Saya benar-benar mendeteksi beberapa krisis eksistensial tentang “kejatuhan Barat” dan “kebangkitan Tiongkok”, yang memotivasi beberapa diskusi yang ramai seputar DeepSeek, dan yang lain telah menghubungkannya dengan bagaimana pengguna AS bergabung dengan aplikasi Xiaohongshu (alias “Little Buku Merah”) ketika TikTok sempat dilarang di negara ini, hanya untuk dibuat takjub dengan kualitas hidup di Tiongkok yang tergambar dalam video yang dibagikan di sana. Kedatangan DeepSeek R1 terjadi dalam konteks naratif ini — konteks di mana Tiongkok tampak (dan jelas dalam banyak metrik) berpengaruh sementara AS tampak (dan dalam banyak metrik, juga) mengalami penurunan.
Model AI Tiongkok yang pertama namun bukan yang terakhir yang mengguncang dunia
Ini juga bukan model AI Tiongkok terakhir yang mengancam dominasi raksasa Silicon Valley – bahkan ketika mereka, seperti OpenAI, mengumpulkan lebih banyak uang untuk ambisi mereka mengembangkan kecerdasan umum buatan (AGI), program yang paling banyak mengungguli manusia. pekerjaan yang bernilai ekonomi.
Baru kemarin, model Tiongkok lainnya dari perusahaan induk TikTok, Bytedance – disebut Doubao-1.5-pro – dirilis dengan kinerja yang menyamai model GPT-4o OpenAI yang tidak masuk akal pada benchmark pihak ketiga, tetapi sekali lagi, dengan biaya 1/50.
Model-model Tiongkok menjadi sangat bagus dan cepat, bahkan mereka yang berada di luar industri teknologi pun memperhatikan: Sang Ekonom majalah baru saja memuat artikel tentang kesuksesan DeepSeek dan upaya AI Tiongkok lainnya, dan komentator politik Matt Bruenig memposting di X bahwa: “Saya telah banyak menggunakan Gemini, ChatGPT, dan Claude untuk ringkasan dokumen NLRB selama hampir satu tahun. Deepseek lebih baik dari mereka semua dalam hal itu. Versi chatbotnya gratis. Harga penggunaan API-nya 99,5% di bawah harga API OpenAI. [shrug emoji]”
Bagaimana tanggapan OpenAI?
Tidak mengherankan jika salah satu pendiri dan CEO OpenAI, Sam Altman hari ini mengatakan bahwa perusahaan tersebut menghadirkan keluarga model penalaran kedua yang belum dirilis, o3, ke ChatGPT bahkan untuk pengguna gratis. OpenAI tampaknya masih membuat jalurnya sendiri dengan model yang lebih eksklusif dan canggih — dengan menetapkan standar industri.
Namun pertanyaannya adalah: dengan DeepSeek, ByteDance, dan perusahaan AI Tiongkok lainnya yang mulai mengejar, berapa lama OpenAI dapat tetap memimpin dalam pembuatan dan peluncuran model AI mutakhir? Dan jika dan kapan jatuhnya, seberapa keras dan cepat penurunannya?
OpenAI memang memiliki preseden sejarah lain. Jika DeepSeek dan model AI Tiongkok benar-benar masuk ke dalam LLM seperti yang dilakukan Android open source Google terhadap perangkat seluler — mengambil alih pangsa pasar terbesar untuk sementara waktu — Anda hanya perlu melihat bagaimana Apple iPhone dengan sistemnya yang terkunci, berpemilik, dan serba guna. House Approach berhasil menguasai pasar kelas atas dan terus berkembang ke bawah, terutama di AS, hingga kini mereka menguasai hampir 60% pasar ponsel pintar dalam negeri.
Namun, bagi mereka yang menghabiskan banyak uang untuk menggunakan model AI dari laboratorium terkemuka, DeepSeek menunjukkan bahwa kemampuan yang sama mungkin tersedia dengan harga yang jauh lebih murah dan dengan kontrol yang jauh lebih besar. Dan dalam lingkungan perusahaan, hal itu mungkin cukup untuk memenangkan pertandingan.