
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Narasi AI telah mencapai titik belok kritis. Terobosan Deepseek-mencapai kinerja canggih tanpa mengandalkan chip paling canggih-membuktikan apa yang telah dinyatakan oleh banyak orang di bulan Desember: masa depan AI bukan tentang melemparkan lebih banyak komputasi pada masalah-ini tentang menata ulang bagaimana sistem ini bekerja dengan manusia dan lingkungan kita.
Sebagai seorang ilmuwan komputer berpendidikan Stanford yang menyaksikan janji dan bahaya pengembangan AI, saya melihat momen ini bahkan lebih transformatif daripada debut chatgpt. Kami memasuki apa yang oleh beberapa orang disebut sebagai “penalaran kebangkitan.” O1 Openai, Deepseek's R1, dan yang lainnya bergerak melewati penskalaan brute-force menuju sesuatu yang lebih cerdas-dan melakukannya dengan efisiensi yang belum pernah terjadi sebelumnya.
Pergeseran ini tidak bisa lebih tepat waktu. Selama keynote Neurips -nya, mantan Kepala Ilmuwan Openai Ilya Sutskever menyatakan bahwa “pretraining akan berakhir” karena sementara daya komputasi tumbuh, kami dibatasi oleh data internet yang terbatas. Terobosan Deepseek memvalidasi perspektif ini – para peneliti perusahaan China mencapai kinerja yang sebanding dengan O1 Openai di sebagian kecil dari biaya, menunjukkan bahwa inovasi, bukan hanya kekuatan komputasi mentah, adalah jalur ke depan.
AI canggih tanpa pra-pelatihan besar-besaran
Model dunia melangkah untuk mengisi celah ini. Kenaikan $ 230 juta baru -baru ini di World Labs untuk membangun sistem AI yang memahami realitas seperti manusia melakukan paralel dari pendekatan Deepseek, di mana model R1 mereka menunjukkan “Aha!” Momen-berhenti untuk mengevaluasi kembali masalah seperti halnya manusia. Sistem ini, yang diilhami oleh proses kognitif manusia, berjanji untuk mengubah segala sesuatu mulai dari pemodelan lingkungan hingga interaksi manusia-AI.
Kami melihat kemenangan awal: Pembaruan terbaru Meta untuk kacamata pintar Ray-Ban mereka memungkinkan percakapan kontekstual yang berkelanjutan dengan asisten AI tanpa kata-kata bangun, di samping terjemahan waktu nyata. Ini bukan hanya pembaruan fitur-ini adalah pratinjau bagaimana AI dapat meningkatkan kemampuan manusia tanpa memerlukan model pra-terlatih yang besar.
Namun, evolusi ini datang dengan tantangan yang bernuansa. Sementara Deepseek telah secara dramatis mengurangi biaya melalui teknik pelatihan yang inovatif, terobosan efisiensi ini dapat secara paradoks mengarah pada peningkatan konsumsi sumber daya secara keseluruhan – sebuah fenomena yang dikenal sebagai Jevons Paradox, di mana peningkatan efisiensi teknologi sering menghasilkan peningkatan daripada penurunan penggunaan sumber daya.
Dalam kasus AI, pelatihan yang lebih murah dapat berarti lebih banyak model yang dilatih oleh lebih banyak organisasi, yang berpotensi meningkatkan konsumsi energi bersih. Tetapi inovasi Deepseek berbeda: dengan menunjukkan bahwa kinerja canggih dimungkinkan tanpa perangkat keras mutakhir, mereka tidak hanya membuat AI lebih efisien-mereka pada dasarnya mengubah cara kami mendekati pengembangan model.
Pergeseran ke arah arsitektur yang cerdas atas kekuatan komputasi mentah ini dapat membantu kita melarikan diri dari jebakan paradoks Jevons, karena fokus bergerak dari “Berapa banyak komputasi yang mampu kita beli?” untuk “Seberapa cerdas kita dapat merancang sistem kita?” Seperti yang dicatat oleh profesor UCLA Guy Van Den Broeck, “Biaya keseluruhan penalaran model bahasa tentu tidak akan turun.” Dampak lingkungan dari sistem ini tetap substansial, mendorong industri menuju solusi yang lebih efisien – persis jenis inovasi yang diwakili Deepseek.
Memprioritaskan arsitektur yang efisien
Pergeseran ini menuntut pendekatan baru. Keberhasilan Deepseek memvalidasi fakta bahwa masa depan bukan tentang membangun model yang lebih besar – ini tentang membangun yang lebih pintar, lebih efisien yang bekerja selaras dengan kecerdasan manusia dan kendala lingkungan.
Kepala Ilmuwan AI Meta Yann Lecun membayangkan sistem masa depan menghabiskan berhari -hari atau berminggu -minggu memikirkan masalah yang kompleks, seperti halnya manusia. Model Deepseek-R1, dengan kemampuannya untuk menjeda dan mempertimbangkan kembali pendekatan, mewakili langkah menuju visi ini. Sementara sumber daya intensif, pendekatan ini dapat menghasilkan terobosan dalam solusi perubahan iklim, inovasi perawatan kesehatan dan seterusnya. Tetapi ketika Ameet Talwalkar dari Carnegie Mellon memperingatkan dengan bijak, kita harus mempertanyakan siapa pun yang mengklaim kepastian tentang ke mana teknologi ini akan memimpin kita.
Untuk para pemimpin perusahaan, pergeseran ini menghadirkan jalur yang jelas ke depan. Kita perlu memprioritaskan arsitektur yang efisien. Salah satu yang bisa:
- Menyebarkan rantai agen AI khusus daripada model masif tunggal.
- Investasikan dalam sistem yang mengoptimalkan dampak kinerja dan lingkungan.
- Bangun infrastruktur yang mendukung pengembangan iteratif, manusia-in-loop.
Inilah yang menggairahkan saya: Terobosan Deepseek membuktikan bahwa kita bergerak melewati era “lebih besar lebih baik” dan menjadi sesuatu yang jauh lebih menarik. Dengan pretraining mencapai batasan dan perusahaan inovatif menemukan cara baru untuk mencapai lebih banyak dengan lebih sedikit, ada ruang yang luar biasa yang membuka untuk solusi kreatif.
Rantai pintar dari agen yang lebih kecil dan khusus tidak hanya lebih efisien – mereka akan membantu kami memecahkan masalah dengan cara yang tidak pernah kami bayangkan. Untuk startup dan perusahaan yang bersedia berpikir secara berbeda, ini adalah momen kita untuk bersenang -senang dengan AI lagi, untuk membangun sesuatu yang benar -benar masuk akal bagi orang dan planet ini.
Kiara Nirghin adalah teknolog Stanford pemenang penghargaan, penulis terlaris dan salah satu pendiri Chima.
DatadecisionMakers
Selamat datang di komunitas VentureBeat!
DatadecisionMakers adalah tempat para ahli, termasuk orang teknis yang melakukan pekerjaan data, dapat berbagi wawasan dan inovasi terkait data.
Jika Anda ingin membaca tentang ide-ide mutakhir dan informasi terkini, praktik terbaik, dan masa depan teknologi data dan data, bergabunglah dengan kami di DatadecisionMakers.
Anda bahkan mungkin mempertimbangkan untuk menyumbangkan artikel Anda sendiri!
Baca lebih lanjut dari pembuat data