
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Untuk mendapatkan hasil terbaik dari kueri AI, organisasi membutuhkan data terbaik.
Jawaban bahwa banyak organisasi harus mengatasi tantangan itu adalah Generasi Pengambilan-Pengambilan (RAG). Dengan kain, hasilnya didasarkan pada data dari database. Namun, ternyata, tidak semua kain sama, dan benar -benar mengoptimalkan database untuk hasil terbaik yang mungkin bisa menjadi tantangan.
Vendor Basis Data Mongodb tidak asing dengan dunia AI atau Rag. Database senama perusahaan sudah digunakan untuk RAG, dan MongoDB juga telah meluncurkan inisiatif pengembangan aplikasi AI. Sementara perusahaan dan penggunanya – raksasa medis Novo Nordisk – telah berhasil dengan Jenderal AI, masih ada lagi yang harus dilakukan.
Secara khusus, halusinasi dan akurasi terus menjadi masalah yang menahan beberapa organisasi dari mendapatkan gen AI ke dalam produksi. Untuk itu, MongoDB hari ini mengumumkan akuisisi Voyage AI yang dipegang secara pribadi, yang mengembangkan model penyematan dan pengambilan canggih. Voyage mengumpulkan $ 20 juta dalam pendanaan pada Oktober 2024 dalam putaran yang didukung oleh raksasa data cloud Snowflake. Akuisisi ini akan membawa keahlian Voyage AI dalam menanamkan generasi dan reranking-komponen penting untuk pencarian dan pengambilan bertenaga AI-langsung ke platform basis data MongoDB.
“Selama setahun terakhir, dan terutama ketika organisasi telah mencoba memikirkan bagaimana mereka dapat membangun aplikasi bertenaga AI, menjadi semakin jelas bahwa kualitas dan kepercayaan dari aplikasi yang mereka bangun, atau ketiadaannya, menjadi salah satu hambatan untuk Menerapkan AI untuk Misi Kasus Penggunaan Kritis, ”CPO MongoDB Sahir Azam mengatakan kepada VentureBeat.
Apa tantangan halusinasi? Bukankah Rag menyelesaikannya?
Ide dasar di balik RAG adalah bahwa, alih -alih hanya mengandalkan basis pengetahuan dari data yang terlatih, mesin Gen AI bisa mendapatkan data ground dari database.
Membuat kain yang sangat akurat cukup kompleks, dan masih ada risiko potensial untuk halusinasi – tantangan yang dihadapi oleh MongoDB dan penggunanya. Sementara Azam menolak untuk memberikan contoh atau insiden spesifik di mana Gen Ai Rag gagal pengguna, ia mencatat bahwa akurasi selalu menjadi perhatian.
Meningkatkan akurasi dan mengurangi halusinasi melibatkan beberapa langkah. Yang pertama adalah meningkatkan kualitas pengambilan ('r' dalam kain).
“Dalam banyak kasus, kualitas pengambilan tidak cukup baik,” Tuangyu MA, pendiri dan CEO Voyage AI, mengatakan kepada VentureBeat. “Pada langkah pengambilan, jika mereka tidak mengambil informasi yang relevan, maka pengambilan tidak terlalu berguna, dan model bahasa besar (LLM) berhalusinat karena harus menebak beberapa konteks.”
Model AI Voyage sekarang bagian dari MongoDB membantu meningkatkan kain dalam beberapa cara utama:
- Model dan peringkat ulang khusus domain: Ini dilatih pada sejumlah besar data tidak terstruktur dari vertikal tertentu, memungkinkan mereka untuk lebih memahami terminologi dan semantik dari domain tersebut.
- Kustomisasi dan penyesuaian: Pengguna dapat menyempurnakan mekanisme pengambilan untuk kumpulan data yang unik dan menggunakan kasus.
Kompetisi Mongodb
MongoDB bukan vendor pertama atau satu-satunya yang mengenali kebutuhan dan nilai memiliki teknologi embedding dan ranker yang sangat dioptimalkan. Lagi pula, itulah salah satu alasan Snowflake yang diinvestasikan dalam Voyage AI dan menggunakan model perusahaan.
Penting untuk dicatat bahwa, bahkan setelah diakuisisi oleh MongoDB, model Voyage AI masih akan tersedia untuk Snowflake dan untuk Voyage pengguna lain AI. Perbedaan besar adalah bahwa Voyage AI sekarang akan semakin terintegrasi ke dalam platform basis data MongoDB.
Secara langsung mengintegrasikan model embedding canggih dalam database adalah pendekatan yang diambil oleh vendor database saingan lainnya. Kembali pada bulan Juni 2024, DataStax mengumumkan teknologi Ragstack sendiri yang menggabungkan model embedding dan pengambilan canggih.
Azam berpendapat bahwa MongoDB sedikit berbeda. Untuk satu, ini adalah database operasional, yang bertentangan dengan database analitik. Juga, sebagai lawan dari hanya memberikan wawasan dan analisis, MongoDB membantu transaksi daya dan operasi dunia nyata. MongoDB juga apa yang dikenal sebagai “Database Model Dokumen,” yang memiliki struktur berbeda dari database relasional tradisional. Struktur itu tidak bergantung pada kolom dan tabel, yang tidak terlalu baik dalam mewakili informasi tentang data yang tidak terstruktur (elemen penting untuk aplikasi AI).
“Kami satu -satunya teknologi basis data yang menggabungkan manajemen metadata tentang informasi pelanggan, operasi dan transaksi, yang merupakan detak jantung dari apa yang terjadi dalam bisnis, serta fondasi untuk pengambilan – semua dengan satu sistem,” kata Azam.
Mengapa Voyage AI Penting untuk Alur Kerja Agen AI
Kebutuhan akan model penyematan dan pengambilan yang sangat akurat semakin dipercepat oleh AI agen.
“Agen AI masih membutuhkan metode pengambilan, karena agen tidak dapat membuat keputusan di luar konteks,” kata Ma. “Kadang -kadang, sebenarnya komponen pengambilan berganda digunakan bahkan dalam satu keputusan.”
Ma mencatat bahwa Voyage AI saat ini sedang mengerjakan model spesifik yang sangat disesuaikan untuk kasus penggunaan AI agen. Dia menjelaskan bahwa AI agen dapat menggunakan berbagai jenis kueri yang masih dapat memperoleh manfaat dari lebih banyak optimasi.
Karena Gen AI semakin beralih ke kasus penggunaan operasional, kebutuhan untuk menghilangkan risiko halusinasi jelas sangat penting. Sementara MongoDB telah berhasil dengan Jenderal AI, Azam mengharapkan integrasi Voyage AI untuk membuka kasus penggunaan kritis misi baru.
“If we can now say, 'Hey, we can give you well north of 90% accuracy for your applications that today may only, in some cases, get to 30 or 60% accuracy for the results,' the aperture widens in terms of Jenis -jenis peluang yang dapat diterapkan orang dalam aplikasi perangkat lunak mereka, ”kata Azam.