
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Perusahaan perusahaan perlu mencatat penelitian mendalam Openai. Ini menyediakan produk yang kuat berdasarkan kemampuan baru, dan sangat bagus sehingga bisa membuat banyak orang keluar dari pekerjaan.
Penelitian mendalam berada di tepi pendarahan dari tren yang berkembang: mengintegrasikan model bahasa besar (LLM) dengan mesin pencari dan alat lain untuk sangat memperluas kemampuan mereka. (Sama seperti artikel ini dilaporkan, misalnya, XAI Elon Musk meluncurkan Grok 3, yang mengklaim kemampuan serupa, termasuk produk pencarian yang mendalam. Namun, masih terlalu dini untuk menilai kinerja dunia nyata Grok 3, karena sebagian besar pelanggan belum pernah benar -benar mendapatkannya di atasnya.)
Openai's Deep Research, dirilis pada 3 Februari, membutuhkan akun Pro dengan OpenAi, seharga $ 200 per bulan, dan saat ini hanya tersedia untuk pengguna AS. Sejauh ini, pembatasan ini mungkin memiliki umpan balik awal yang terbatas dari komunitas pengembang global, yang biasanya cepat membedah kemajuan AI baru.
Dengan mode penelitian yang mendalam, pengguna dapat menanyakan pertanyaan O3 terkemuka Openai. Hasilnya? Sebuah laporan yang sering lebih unggul dari apa yang diproduksi analis manusia, memberikan lebih cepat dan dengan biaya yang sebagian besar.
Seberapa mendalam penelitian bekerja
Sementara penelitian mendalam telah banyak dibahas, implikasinya yang lebih luas belum sepenuhnya mendaftar. Reaksi awal memuji kemampuan penelitiannya yang mengesankan, meskipun ada halusinasi dalam kutipannya. Ada pria yang mengatakan dia menggunakannya untuk membantu istrinya yang menderita kanker payudara. Ini memberikan analisis yang lebih dalam dari apa yang disediakan oleh ahli onkolognya tentang bagaimana terapi radiasi adalah tindakan yang tepat, katanya. Konsensus, yang dirangkum oleh Wharton AI Profesor Ethan Mollick, adalah bahwa keunggulannya jauh lebih besar daripada ketidakakuratan sesekali, karena pengecekan fakta membutuhkan waktu lebih sedikit daripada yang disimpan AI secara keseluruhan. Ini adalah sesuatu yang saya setujui, berdasarkan penggunaan saya sendiri.
Lembaga keuangan sudah mengeksplorasi aplikasi. BNY, bank top-12 di AS, misalnya, melihat potensi dalam menggunakan penelitian mendalam untuk penilaian risiko kredit. Dampaknya akan meluas lintas industri, dari perawatan kesehatan hingga ritel, manufaktur, dan manajemen rantai pasokan – hampir semua bidang yang bergantung pada pekerjaan pengetahuan.
Agen penelitian yang lebih cerdas
Tidak seperti model AI tradisional yang mencoba jawaban satu-shot, penelitian mendalam terlebih dahulu menanyakan pertanyaan yang mengklarifikasi. Mungkin mengajukan empat pertanyaan atau lebih untuk memastikan itu memahami dengan tepat apa yang Anda inginkan. Ini kemudian mengembangkan rencana penelitian terstruktur, melakukan beberapa pencarian, merevisi rencananya berdasarkan wawasan baru, dan berulang dalam satu loop hingga menyusun laporan yang komprehensif dan diformat dengan baik. Ini bisa memakan waktu antara beberapa menit setengah jam. Laporan berkisar dari 1.500 hingga 20.000 kata, dan biasanya mencakup kutipan dari 15 hingga 30 sumber dengan URL yang tepat, setidaknya sesuai dengan penggunaan saya selama satu setengah minggu terakhir.
Teknologi di balik penelitian mendalam: penalaran llms dan kain agen
Deep Research melakukan ini dengan menggabungkan dua teknologi dengan cara yang belum pernah kita lihat sebelumnya dalam produk pasar massal.
Penalaran llms: Yang pertama adalah model mutakhir Openai, O3, yang mengarah dalam penalaran logis dan proses rantai-dipikirkan yang diperluas. Ketika diumumkan pada bulan Desember 2024, O3 mencetak 87,5% yang belum pernah terjadi sebelumnya pada tolok ukur busur super-difikfik yang dirancang untuk menguji kemampuan pemecahan masalah novel. Yang menarik adalah bahwa O3 belum dirilis sebagai model mandiri untuk digunakan pengembang. Memang, CEO Openai Sam Altman mengumumkan minggu lalu bahwa model itu sebaliknya akan dibungkus menjadi sistem “Intelijen Terpadu”, yang akan menyatukan model dengan alat agen seperti pencarian, agen pengkodean dan banyak lagi. Penelitian yang mendalam adalah contoh dari produk semacam itu. Dan sementara pesaing seperti Deepseek-R1 telah mendekati kemampuan O3 (salah satu alasan mengapa ada begitu banyak kegembiraan beberapa minggu yang lalu), Openai masih dianggap sedikit di depan.
Kain agen: Yang kedua, agen agen, adalah teknologi yang telah ada selama sekitar satu tahun sekarang. Ini menggunakan agen untuk secara mandiri mencari informasi dan konteks dari sumber lain, termasuk mencari di internet. Ini dapat mencakup agen pemanggilan alat lain untuk menemukan informasi non-WEB melalui API; agen pengkodean yang dapat menyelesaikan urutan kompleks secara lebih efisien; dan pencarian basis data. Awalnya, penelitian mendalam Openai terutama mencari web terbuka, tetapi para pemimpin perusahaan telah menyarankan mereka akan dapat mencari lebih banyak sumber dari waktu ke waktu.
Tepi kompetitif Openai (dan batasnya)
Meskipun teknologi ini tidak sepenuhnya baru, penyempurnaan Openai-diaktifkan oleh hal-hal seperti jump-start untuk mengerjakan teknologi ini, dana besar-besaran, dan model pengembangan sumber tertutupnya-telah membawa riset mendalam ke tingkat yang baru. Ini dapat bekerja di balik pintu tertutup, dan memanfaatkan umpan balik dari lebih dari 300 juta pengguna aktif produk chatgpt populer Openai. Openai telah memimpin dalam penelitian di bidang -bidang ini, misalnya dalam cara melakukan verifikasi langkah demi langkah untuk mendapatkan hasil yang lebih baik. Dan itu telah menerapkan pencarian dengan jelas dengan cara yang menarik, mungkin meminjam dari Bing Microsoft dan teknologi lainnya.
Meskipun masih berhalusinasi beberapa hasil dari pencariannya, ia melakukannya kurang dari pesaing, mungkin sebagian karena model O3 yang mendasarinya sendiri telah menetapkan industri rendah untuk halusinasi ini sebesar 8%. Dan ada cara untuk mengurangi kesalahan lebih jauh, dengan menggunakan mekanisme seperti ambang kepercayaan, persyaratan kutipan dan pemeriksaan kredibilitas canggih lainnya.
Pada saat yang sama, ada batasan untuk memimpin dan kemampuan Openai. Dalam dua hari peluncuran Deep Research, HuggingFace memperkenalkan agen penelitian AI open-source yang disebut Open Deep Research yang mendapatkan hasil yang tidak terlalu jauh dari Openai-sama-sama menggabungkan model terkemuka dan kemampuan agen yang tersedia secara bebas. Ada beberapa parit. Pesaing open-source seperti Deepseek tampaknya akan tetap dekat di bidang model penalaran, dan Microsoft's Magentic-One menawarkan kerangka kerja untuk sebagian besar kemampuan agen Openai, untuk menyebutkan hanya dua contoh lagi.
Selain itu, penelitian mendalam memiliki keterbatasan. Produk ini sangat efisien dalam meneliti informasi tidak jelas yang dapat ditemukan di web. Tetapi di bidang -bidang di mana tidak ada banyak online dan di mana keahlian domain sebagian besar bersifat pribadi – baik di kepala orang atau dalam database pribadi – itu tidak berfungsi sama sekali. Jadi ini tidak akan mengancam pekerjaan para peneliti pendanaan lindung nilai kelas atas, misalnya, yang dibayar untuk berbicara dengan para ahli nyata dalam suatu industri untuk mencari tahu informasi yang sangat sulit untuk diabaikan, seperti yang dikatakan Ben Thompson Dalam posting terbaru (lihat grafik di bawah). Dalam kebanyakan kasus, penelitian mendalam Openai akan mempengaruhi pekerjaan analis berketerampilan rendah.
Produk paling cerdas
Saat Anda menggabungkan penalaran tingkat atas dengan pengambilan agen, tidak terlalu mengejutkan bahwa Anda mendapatkan produk yang begitu kuat. Penelitian mendalam Openai mencapai 26,6% pada ujian terakhir umat manusia, bisa dibilang patokan terbaik untuk kecerdasan. Ini adalah tolok ukur AI yang relatif baru yang dirancang untuk menjadi yang paling sulit bagi model AI apa pun untuk menyelesaikannya, mencakup 3.000 pertanyaan di 100 subjek yang berbeda. Pada tolok ukur ini, penelitian mendalam Openai secara signifikan mengungguli penelitian mendalam Perplexity (20,5%) dan model sebelumnya seperti O3-Mini (13%) dan Deepseek-R1 (9,4%) yang tidak terhubung dengan kain agen. Namun ulasan awal menyarankan prospek OpenAI dalam kualitas dan kedalaman. Penelitian mendalam Google belum diuji terhadap tolok ukur ini, tetapi ulasan awal menyarankan prospek openai dalam kualitas dan kedalaman.
Apa bedanya: AI pasar massal pertama yang dapat menggantikan pekerjaan
Apa yang berbeda dengan produk ini adalah potensinya untuk menghilangkan pekerjaan. Sam Witteveen, pendiri Red Dragon dan pengembang agen AI, yang diamati dalam diskusi video penyelaman yang mendalam dengan saya bahwa banyak orang akan mengatakan: “Sialan, saya bisa mendapatkan laporan ini seharga $ 200 yang bisa saya dapatkan dari Beberapa perusahaan konsultan top-4 yang akan menelan biaya $ 20.000. ” Ini, katanya, akan menyebabkan beberapa perubahan nyata, termasuk kemungkinan menempatkan orang keluar dari pekerjaan.
Yang membawa saya kembali ke wawancara saya minggu lalu dengan Sarthak Pattanaik, Kepala Teknik dan AI di BNY, sebuah bank besar AS yang berbasis di New York City.
Yang pasti, Pattanaik tidak mengatakan apa -apa tentang konsekuensi produk untuk jumlah pekerjaan yang sebenarnya di banknya. Itu akan menjadi topik yang sangat sensitif bahwa perusahaan mana pun mungkin akan menghindar dari berbicara secara publik. Namun dia mengatakan dia bisa melihat penelitian mendalam Openai digunakan untuk laporan penjaminan kredit dan kegiatan “topline” lainnya, dan memiliki dampak yang signifikan pada berbagai pekerjaan: “Sekarang itu tidak berdampak pada setiap pekerjaan, tetapi itu memang berdampak pada serangkaian pekerjaan di sekitar strategi [and] penelitian, seperti manajemen vendor perbandingan, perbandingan produk a versus produk B. ” Dia menambahkan: “Jadi saya pikir segala sesuatu yang lebih pada sistem dua pemikiran – lebih eksplorasi, di mana ia mungkin tidak memiliki jawaban yang benar, karena jawaban yang tepat dapat dipasang setelah Anda memiliki definisi skenario itu – saya pikir itu adalah kesempatan.”
Perspektif Historis: Kehilangan lapangan kerja dan penciptaan lapangan kerja
Revolusi teknologi secara historis menggeser pekerja dalam jangka pendek sambil menciptakan industri baru dalam jangka panjang. Dari mobil yang menggantikan kereta kuda ke komputer mengotomatisasi pekerjaan administrasi, pasar kerja berkembang. Peluang baru yang diciptakan oleh teknologi yang mengganggu cenderung menelurkan perekrutan baru. Perusahaan yang gagal merangkul kemajuan ini akan tertinggal di belakang pesaing mereka.
Altman Openai mengakui tautan itu, bahkan jika tidak langsung, antara penelitian yang mendalam dan tenaga kerja. Di KTT AI di Paris minggu lalu, ia ditanya tentang visinya untuk Kecerdasan Umum Buatan (AGI), atau panggung di mana AI dapat melakukan hampir semua tugas yang dapat dilakukan manusia. Saat dia menjawab, referensi pertamanya adalah untuk penelitian yang mendalam: “Ini adalah model yang menurut saya mampu melakukan seperti persentase digit rendah dari semua tugas dalam perekonomian di dunia saat ini, yang merupakan pernyataan gila, dan Setahun yang lalu saya tidak berpikir sesuatu yang menurut orang akan datang. ” (Lihat menit tiga dari video ini). Dia melanjutkan: “Untuk 50 sen komputasi, Anda dapat melakukan pekerjaan $ 500 atau $ 5.000. Perusahaan menerapkannya untuk menjadi jauh lebih efisien. ”
The Takeaway: Era Baru untuk Pekerjaan Pengetahuan
Penelitian mendalam merupakan momen penting untuk AI dalam industri berbasis pengetahuan. Dengan mengintegrasikan penalaran mutakhir dengan kemampuan penelitian otonom, OpenAI telah menciptakan alat yang lebih pintar, lebih cepat dan secara signifikan lebih hemat biaya daripada analis manusia.
Implikasinya sangat luas, dari jasa keuangan hingga perawatan kesehatan hingga pengambilan keputusan perusahaan. Organisasi yang memanfaatkan teknologi ini secara efektif akan mendapatkan keunggulan kompetitif yang signifikan. Mereka yang mengabaikannya melakukannya dengan bahaya mereka.
Untuk diskusi yang lebih dalam tentang bagaimana penelitian mendalam Openai bekerja, dan bagaimana cara membentuk kembali pekerjaan pengetahuan, lihat percakapan mendalam saya dengan Sam Witteveen dalam video terbaru kami: