
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Jika Anda melewatkannya demi Grammy Awards tadi malam, Openai mengejutkan dunia pada Minggu malam dengan pengumuman modalitas “Deep Research” yang baru, agen AI yang tersedia untuk Pengguna Berlangganan Chatgpt Pro ($ 200/bulan) yang dirancang yang dirancang Untuk menghemat jam manusia dengan meneliti, yah, “dalam” dan secara luas di seluruh web untuk topik yang diberikan dan menyusun laporan kualitas profesional di seluruh domain khusus dari bisnis ke sains, kedokteran, pemasaran dan banyak lagi.
Pengguna ChatGPT Pro (dan segera, ChatGPT Plus, Team, Enterprise dan EDU) di AS akan dapat mengakses penelitian mendalam dengan mengklik opsi di bawah bilah entri/komposisi prompt di bagian bawah situs web dan aplikasi ChatGPT.
Sam Altman, CEO Openai, menggambarkan fitur tersebut dalam serangkaian posting di akun pribadinya di jejaring sosial X sebagai “seperti negara adidaya; Pakar sesuai permintaan! ” Dia menambahkan, “Ini sangat bagus, dan dapat melakukan tugas yang akan memakan waktu berjam -jam/hari dan biaya ratusan dolar.”
Deep Research dibangun di atas serangkaian model penalaran Openai, khususnya memanfaatkan model O3 penuh yang akan segera dirilis (model yang lebih kecil dan kurang kuat, O3-Mini, baru saja diluncurkan pada hari Jumat). Model O3 lengkap dapat menganalisis sejumlah besar informasi dan mengintegrasikan teks, PDF, dan gambar ke dalam analisis yang kohesif.
Dalam streaming langsung yang diposting ke YouTube dan tersedia untuk replay on Demand, Mark Chen, kepala perbatasan Openai Research, menjelaskan bahwa “Penelitian mendalam adalah model yang melakukan penelitian multi-langkah di internet. Ini menemukan konten, mensintesis konten, dan alasan tentang konten ini, mengadaptasi rencananya karena mengungkap lebih banyak dan lebih banyak informasi. “
Chen lebih lanjut menyoroti pentingnya inovasi untuk visi Openai: “Ini adalah inti dari peta jalan AGI kita. Aspirasi utama kami adalah model yang dapat mengungkap dan menemukan pengetahuan baru untuk dirinya sendiri. ”
Peluncuran Deep Research menandai yang kedua dalam agen resmi Openai setelah peluncuran browser dan operator pengendali kursor awal bulan ini. Dan Joshua Achiam, kepala penyelarasan misi di Stargate Command di Openai menulis di X, kedua model dapat membantu lebih menentukan konsep “agen AI” – istilah yang populer tetapi samar -samar hari ini di antara perusahaan – jauh di luar perusahaan atau penggunaan spesifik ini ini kasus.
“Saya merasa seperti istilah 'agen' berkeliaran di padang pasir untuk sementara waktu,” tulis Achaim. “Itu tidak memiliki landasan atau contoh yang harus ditunjukkan. Tetapi agen seperti operator atau penelitian mendalam memberikan beberapa bentuk pada konsep ini. Agen adalah AI tujuan umum yang melakukan satu atau lebih alur kerja menggunakan alat untuk Anda. “
Penelitian mendalam Openai mencapai skor baru, tertinggi pada tolok ukur AI 'Ujian terakhir umat manusia'
Deep Research telah menetapkan tolok ukur baru untuk akurasi dan penalaran.
Isa Fulford, anggota tim peneliti Openai, dibagikan di langsung YouTube bahwa model tersebut mencapai “akurasi tertinggi 26,6%” pada “Ujian Terakhir Kemanusiaan”, tolok ukur AI yang relatif baru yang dirancang untuk menjadi yang paling sulit untuk model AI mana pun ( atau manusia, dalam hal ini) untuk menyelesaikan, mencakup 3.000 pertanyaan di 100 subjek yang berbeda, seperti menerjemahkan prasasti kuno tentang temuan arkeologis.

Selain itu, kemampuannya untuk menelusuri web, beralasan secara dinamis, dan mengutip sumber secara tepat membedakannya dari alat AI sebelumnya.
“Model ini dilatih menggunakan pembelajaran penguatan ujung ke ujung pada tugas penelusuran keras dan penalaran,” kata Fulford. “Itu belajar merencanakan dan menjalankan lintasan multi-langkah, bereaksi terhadap informasi waktu nyata dan mundur bila perlu.”
Fitur yang menonjol dari penelitian mendalam adalah kapasitasnya untuk menangani tugas -tugas yang seharusnya membutuhkan waktu berjam -jam manusia atau bahkan berhari -hari.
Selama pengumuman, Chen menjelaskan bahwa “penelitian mendalam menghasilkan output yang menyerupai makalah penelitian yang komprehensif dan sepenuhnya dikutip – sesuatu yang mungkin dihasilkan oleh seorang analis atau ahli di lapangan.”
Aplikasi dan Kasing Penggunaan
Kasus penggunaan untuk penelitian mendalam beragam seperti halnya berdampak.
Akun Openai resmi di X menyatakan bahwa “dibangun untuk orang -orang yang melakukan pekerjaan pengetahuan intensif di bidang -bidang seperti keuangan, sains, kebijakan & teknik dan membutuhkan penelitian yang menyeluruh & andal.”
Tampaknya juga berharga bagi konsumen yang mencari rekomendasi yang dipersonalisasi atau melakukan riset produk terperinci, menurut contoh yang dibagikan oleh OpenAI pada posting blog pengumuman penelitian resmi, yang mencakup penilaian penelitian terperinci tentang papan seluncur salju terbaik untuk dibeli seseorang.
Altman merangkum keserbagunaan alat, menulis, “Cobalah tugas kerja tersulit Anda yang dapat diselesaikan hanya dengan menggunakan internet dan melihat apa yang terjadi.”
Kisah Sukses Medis Pribadi dari Penelitian yang mendalam
Felipe Millon, pemeran utama pemerintah Openai, berbagi akun yang sangat pribadi tentang seberapa mendalam penelitian memengaruhi keluarganya. Menulis dalam serangkaian posting di X, ia menggambarkan pertempuran istrinya dengan kanker payudara bilateral dan bagaimana alat AI menjadi sekutu yang tidak terduga.
“Pada akhir Oktober, istri saya didiagnosis menderita kanker payudara bilateral. Semalam, dunia kita terbalik, ”tulis Millon.
Setelah mastektomi ganda dan kemoterapi, pasangan ini menghadapi keputusan kritis: apakah akan mengejar terapi radiasi atau tidak. Situasi itu penuh dengan ketidakpastian, karena bahkan spesialis mereka memberikan rekomendasi beragam. “Untuk kasus spesifiknya, itu sepenuhnya di area abu -abu,” Millon menjelaskan. “Kami merasa macet.”
Memiliki pratinjau akses ke penelitian mendalam, Millon memutuskan untuk mengunggah laporan patologi bedah istrinya dan bertanya apakah radiasi akan bermanfaat. “Apa yang terjadi selanjutnya adalah menakjubkan,” tulisnya. “Itu tidak hanya mengkonfirmasi apa yang disebutkan oleh ahli onkologi kami – itu berjalan lebih dalam. Ini mengutip studi yang belum pernah saya dengar dan beradaptasi ketika kami menambahkan detail seperti usia dan faktor genetiknya. ”
Prompt spesifik yang dia gunakan adalah:
“Baca Laporan Patologi Bedah (terlampir) yang mengandung informasi tentang kanker payudara bilateral. Kemudian teliti apakah radiasi akan diindikasikan untuk pasien ini setelah 6 putaran kemoterapi TCHP, berdasarkan jenis kanker payudara. Saya ingin memahami pro dan kontra radiasi untuk pasien ini, seberapa besar kemungkinan untuk mengurangi peluang kekambuhan, dan apakah manfaatnya lebih besar daripada potensi risiko jangka panjang. ”
Millon dan istrinya memeriksa fakta setiap studi yang dikutip oleh model, menemukan mereka akurat dan sangat relevan. “Kami segera melihat spesialis lain, tetapi kami sudah merasa lebih percaya diri tentang keputusan kami,” tulisnya. “Itu memberi kita ketenangan pikiran ketika kita sangat membutuhkannya.”
Ketersediaan dan apa selanjutnya?
Deep Research saat ini tersedia untuk pengguna Pro ChatGPT, dengan rencana untuk memperluas ke Tingkat Plus dan Team, diikuti oleh pasar perusahaan dan pendidikan.
Ketika Chen memperingatkan, “Masih mungkin bahwa itu akan berhalusinasi, jadi ketika Anda membuat laporan, pastikan untuk memeriksa sumber sendiri.”
Kemampuan model untuk berpikir secara mandiri untuk periode yang lama juga membuatnya intensif sumber daya, dan OpenAI saat ini sedang berupaya mengoptimalkan kinerjanya untuk aksesibilitas yang lebih luas.
Openai juga mengisyaratkan integrasi di masa depan dengan kumpulan data khusus, yang akan memungkinkan organisasi untuk memanfaatkan alat untuk penelitian kepemilikan.
Untuk Millon, dampak penelitian mendalam sudah jelas. “Kami sering berbicara secara internal di Openai tentang saat -saat ketika Anda 'merasakan Agi,' dan ini adalah salah satunya,” tulisnya. “Hal ini akan mengubah dunia.”