
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Para peneliti di Sentient Foundation telah merilis Open Deep Search (ODS), kerangka kerja open-source yang dapat sesuai dengan kualitas solusi pencarian AI berpemilik seperti pencarian kebingungan dan chatgpt. ODS melengkapi model bahasa besar (LLM) dengan agen penalaran canggih yang dapat menggunakan pencarian web dan alat lain untuk menjawab pertanyaan.
Untuk perusahaan yang mencari alat pencarian AI yang dapat disesuaikan, ODS menawarkan alternatif yang menarik dan berkinerja tinggi untuk solusi komersial tertutup.
Lanskap pencarian AI
Alat pencarian AI modern seperti pencarian kebingungan dan chatgpt dapat memberikan jawaban terkini dengan menggabungkan pengetahuan dan kemampuan penalaran LLMS dengan pencarian web. Namun, solusi ini biasanya adalah milik dan sumber tertutup, membuatnya sulit untuk menyesuaikannya dan mengadopsinya untuk aplikasi khusus.
“Sebagian besar inovasi dalam pencarian AI telah terjadi di balik pintu tertutup. Upaya open-source secara historis tertinggal dalam kegunaan dan kinerja,” Himanshu Tyagi, salah satu pendiri Sentient, mengatakan kepada VentureBeat. “ODS bertujuan untuk menutup celah itu, menunjukkan bahwa sistem terbuka dapat bersaing, dan bahkan melampaui, rekan tertutup pada kualitas, kecepatan, dan fleksibilitas.”
Buka Arsitektur Pencarian Dalam (ODS)
Open Deep Search (ODS) dirancang sebagai sistem plug-and-play yang dapat diintegrasikan dengan model open-source seperti Deepseek-R1 dan model tertutup seperti GPT-4O dan Claude.
ODS terdiri dari dua komponen inti, keduanya memanfaatkan LLM basis yang dipilih:
Buka Alat Pencarian: Komponen ini mengambil kueri dan mengambil informasi dari web yang dapat diberikan kepada LLM sebagai konteks. Alat pencarian terbuka melakukan beberapa tindakan utama untuk meningkatkan hasil pencarian dan memastikan bahwa ia memberikan konteks yang relevan dengan model. Pertama, ini mengulangi kueri asli dengan berbagai cara untuk memperluas cakupan pencarian dan menangkap beragam perspektif. Alat ini kemudian mengambil hasil dari mesin pencari, mengekstrak konteks dari hasil teratas (cuplikan dan halaman tertaut), dan menerapkan teknik chunking dan peringkat ulang untuk memfilter konten yang paling relevan. Ini juga memiliki penanganan khusus untuk sumber -sumber spesifik seperti Wikipedia, Arxiv dan PubMed, dan dapat diminta untuk memprioritaskan sumber yang dapat diandalkan ketika menemukan informasi yang bertentangan.
Agen penalaran terbuka: Agen ini menerima kueri pengguna dan menggunakan LLM dasar dan berbagai alat (termasuk alat pencarian terbuka) untuk merumuskan jawaban akhir. Sentient menyediakan dua arsitektur agen yang berbeda di dalam ODS:
ODS-V1: Versi ini menggunakan kerangka kerja React Agent yang dikombinasikan dengan penalaran rantai (COT). Agen bereaksi menginterasi langkah -langkah penalaran (“pikiran”) dengan tindakan (seperti menggunakan alat pencarian) dan pengamatan (hasil alat). ODS-V1 menggunakan bereaksi secara iteratif untuk sampai pada jawaban. Jika agen bereaksi berjuang (sebagaimana ditentukan oleh model juri yang terpisah), itu default ke konsistensi diri COT, yang mengambil sampel beberapa respons COT dari model dan menggunakan jawaban yang paling sering muncul.
ODS-V2: Versi ini memanfaatkan Chain-of-Code (COC) dan agen CODEACT, diimplementasikan menggunakan perpustakaan Hugging Face Smolagents. COC menggunakan kemampuan LLM untuk menghasilkan dan menjalankan cuplikan kode untuk menyelesaikan masalah, sementara CODEACT menggunakan pembuatan kode untuk tindakan perencanaan. ODS-V2 dapat mengatur beberapa alat dan agen, yang memungkinkannya untuk menangani tugas yang lebih kompleks yang mungkin memerlukan perencanaan yang canggih dan berpotensi beberapa iterasi pencarian.

“Sementara alat -alat seperti Chatgpt atau Grok menawarkan 'riset mendalam' melalui agen percakapan, ODS beroperasi di lapisan yang berbeda – lebih mirip dengan infrastruktur di balik kebingungan AI – memberikan arsitektur mendasar yang mendukung pengambilan cerdas, bukan hanya ringkasan,” kata Tyagi.
Hasil kinerja dan praktis
Sentient mengevaluasi OD dengan memasangkannya dengan model Deepseek-R1 open-source dan mengujinya terhadap pesaing sumber tertutup yang populer seperti AI yang bingung dan pratinjau pencarian GPT-4O Openai, serta LLM mandiri seperti GPT-4O dan LLAMA-3.1-70B. Mereka menggunakan bingkai dan tolok ukur imbalan simpleQA, mengadaptasi mereka untuk mengevaluasi keakuratan sistem AI yang diaktifkan pencarian.
Hasilnya menunjukkan daya saing ODS. Baik ODS-V1 dan ODS-V2, ketika dikombinasikan dengan Deepseek-R1, mengungguli produk andalan kebingungan. Khususnya, ODS-V2 dipasangkan dengan Deepseek-R1 melampaui pratinjau pencarian GPT-4O pada tolok ukur frame kompleks dan hampir mencocokkannya di SimpleQA.

Pengamatan yang menarik adalah efisiensi kerangka kerja. Agen penalaran di kedua versi ODS belajar menggunakan alat pencarian secara bijaksana, sering memutuskan apakah pencarian tambahan diperlukan berdasarkan kualitas hasil awal. Misalnya, ODS-V2 menggunakan lebih sedikit pencarian web pada tugas SimpleQA yang lebih sederhana dibandingkan dengan kueri multi-hop yang lebih kompleks dalam bingkai, mengoptimalkan konsumsi sumber daya.
Implikasi untuk perusahaan
Untuk perusahaan yang mencari kemampuan penalaran AI yang kuat yang didasarkan pada informasi waktu-nyata, ODS menyajikan solusi yang menjanjikan yang menawarkan alternatif yang transparan, dapat disesuaikan, dan berkinerja tinggi untuk sistem pencarian AI berpemilik. Kemampuan untuk mencolokkan LLMS dan alat open-source yang disukai memberikan organisasi yang lebih besar kontrol atas tumpukan AI mereka dan menghindari penguncian vendor.
“ODS dibangun dengan mempertimbangkan modularitas,” kata Tyagi. “Ini memilih alat mana yang digunakan secara dinamis, berdasarkan deskripsi yang disediakan dalam prompt. Ini berarti dapat berinteraksi dengan alat yang tidak dikenal dengan lancar-selama mereka digambarkan dengan baik-tanpa memerlukan paparan sebelumnya.”
Namun, ia mengakui bahwa kinerja ODS dapat menurun ketika toolset menjadi kembung, “sangat penting desain.”
Sentient telah merilis kode untuk ODS di GitHub.
“Awalnya, kekuatan kebingungan dan chatgpt adalah teknologi canggih mereka, tetapi dengan ODS, kami telah meratakan lapangan bermain teknologi ini,” kata Tyagi. “Kami sekarang bertujuan untuk melampaui kemampuan mereka melalui strategi 'terbuka dan output terbuka' kami, memungkinkan pengguna untuk mengintegrasikan agen khusus dengan mulus ke dalam obrolan yang hidup.”