
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Para peneliti di Alibaba Group telah mengembangkan pendekatan baru yang dapat secara dramatis mengurangi biaya dan kompleksitas pelatihan sistem AI untuk mencari informasi, menghilangkan kebutuhan akan API mesin pencari komersial yang mahal sama sekali.
Teknik, yang disebut “ZerOsearch,” memungkinkan model bahasa besar (LLM) untuk mengembangkan kemampuan pencarian canggih melalui pendekatan simulasi daripada berinteraksi dengan mesin pencari nyata selama proses pelatihan. Inovasi ini dapat menghemat biaya API yang signifikan perusahaan sambil menawarkan kontrol yang lebih baik atas bagaimana sistem AI belajar untuk mengambil informasi.
“Pembelajaran Penguatan [RL] Pelatihan membutuhkan peluncuran yang sering, berpotensi melibatkan ratusan ribu permintaan pencarian, yang menimbulkan biaya API yang substansial dan sangat membatasi skalabilitas, “tulis para peneliti dalam makalah mereka yang diterbitkan di ArXIV minggu ini.” Untuk mengatasi tantangan ini, kami memperkenalkan Zerosearch, sebuah kerangka pembelajaran penguatan yang mendorong pencarian tanpa kemampuan pencarian tanpa kemampuan pencarian.
Alibaba baru saja menjatuhkan ZeroSearch pada wajah memeluk
Memberi insentif kemampuan pencarian LLMS tanpa mencari pic.twitter.com/qfnijno3lh
– AK (@_akhaliq) 8 Mei 2025
Bagaimana Zerosearch Melatih AI untuk mencari tanpa mesin pencari
Masalah yang dipecahkan oleh Zerosearch adalah signifikan. Perusahaan yang mengembangkan asisten AI yang dapat secara mandiri mencari informasi menghadapi dua tantangan utama: kualitas dokumen yang tidak dapat diprediksi yang dikembalikan oleh mesin pencari selama pelatihan, dan biaya tinggi untuk membuat ratusan ribu panggilan API ke mesin pencari komersial seperti Google.
Pendekatan Alibaba dimulai dengan proses fine-tuning yang diawasi ringan untuk mengubah LLM menjadi modul pengambilan yang mampu menghasilkan dokumen yang relevan dan tidak relevan sebagai respons terhadap kueri. Selama pelatihan pembelajaran penguatan, sistem ini menggunakan apa yang oleh para peneliti disebut sebagai “strategi peluncuran berbasis kurikulum” yang secara bertahap menurunkan kualitas dokumen yang dihasilkan.
“Wawasan utama kami adalah bahwa LLM telah memperoleh pengetahuan dunia yang luas selama pretraining skala besar dan mampu menghasilkan dokumen yang relevan dengan permintaan pencarian,” jelas para peneliti. “Perbedaan utama antara mesin pencari nyata dan simulasi LLM terletak pada gaya tekstual dari konten yang dikembalikan.”
Mengungguli Google di sebagian kecil dari biaya
Dalam percobaan yang komprehensif di tujuh set data imbalan pertanyaan, ZeroSearch tidak hanya cocok tetapi sering melampaui kinerja model yang dilatih dengan mesin pencari nyata. Hebatnya, modul pengambilan parameter 7B mencapai kinerja yang sebanding dengan pencarian Google, sementara modul 14B-parameter bahkan mengungguli.
Penghematan biaya sangat besar. Menurut analisis para peneliti, pelatihan dengan sekitar 64.000 pertanyaan pencarian menggunakan pencarian Google melalui Serpapi akan menelan biaya sekitar $ 586,70, sambil menggunakan llm simulasi 14B-parameter pada empat A100 GPU hanya berharga $ 70,80-pengurangan 88%.
“Ini menunjukkan kelayakan menggunakan LLM yang terlatih sebagai pengganti mesin pencari nyata dalam pengaturan pembelajaran penguatan,” catat kertas.
Apa artinya ini untuk masa depan pengembangan AI
Terobosan ini merupakan perubahan besar dalam cara sistem AI dapat dilatih. ZeroSearch menunjukkan bahwa AI dapat meningkat tanpa tergantung pada alat eksternal seperti mesin pencari.
Dampaknya bisa menjadi substansial untuk industri AI. Sampai sekarang, pelatihan sistem AI canggih sering membutuhkan panggilan API mahal ke layanan yang dikendalikan oleh perusahaan teknologi besar. ZeroSearch mengubah persamaan ini dengan memungkinkan AI untuk mensimulasikan pencarian alih -alih menggunakan mesin pencari yang sebenarnya.
Untuk perusahaan AI yang lebih kecil dan startup dengan anggaran terbatas, pendekatan ini dapat meratakan lapangan bermain. Tingginya biaya panggilan API telah menjadi penghalang utama untuk masuk dalam mengembangkan asisten AI yang canggih. Dengan memotong biaya ini hampir 90%, Zerosearch membuat pelatihan AI canggih lebih mudah diakses.
Di luar penghematan biaya, teknik ini memberi pengembang lebih banyak kontrol atas proses pelatihan. Saat menggunakan mesin pencari nyata, kualitas dokumen yang dikembalikan tidak dapat diprediksi. Dengan pencarian simulasi, pengembang dapat secara tepat mengendalikan informasi apa yang dilihat AI selama pelatihan.
Teknik ini bekerja di berbagai keluarga model, termasuk QWEN-2.5 dan LLAMA-3.2, dan dengan varian basis dan instruksi yang disesuaikan. Para peneliti telah membuat kode, dataset, dan model terlatih mereka yang tersedia di Github dan memeluk wajah, memungkinkan peneliti dan perusahaan lain untuk mengimplementasikan pendekatan tersebut.
Ketika model bahasa besar terus berkembang, teknik seperti Zerosearch menyarankan masa depan di mana sistem AI dapat mengembangkan kemampuan yang semakin canggih melalui rimulasi diri daripada mengandalkan layanan eksternal-berpotensi mengubah ekonomi pengembangan AI dan mengurangi ketergantungan pada platform teknologi besar.
Ironisnya jelas: Dalam mengajar AI untuk mencari tanpa mesin pencari, Alibaba mungkin telah menciptakan teknologi yang membuat mesin pencari tradisional kurang diperlukan untuk pengembangan AI. Karena sistem ini menjadi lebih mandiri, lanskap teknologi bisa terlihat sangat berbeda hanya dalam beberapa tahun.