
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Enterprise Retrieval Augmented Generation (RAG) tetap integral dari kegilaan AI agen saat ini. Mengambil keuntungan dari minat yang berkelanjutan pada agen, Cohere merilis versi terbaru dari model embeddings -nya dengan jendela konteks yang lebih panjang dan lebih banyak multimodalitas.
Embed 4 Cohere dibangun di atas pembaruan multimodal Embed 3 dan menambah lebih banyak kemampuan di sekitar data yang tidak terstruktur. Berkat jendela konteks 128.000 token, organisasi dapat menghasilkan embeddings untuk dokumen dengan sekitar 200 halaman.
“Model embedding yang ada gagal untuk secara alami memahami bahan bisnis multimodal yang kompleks, membuat perusahaan mengembangkan saluran pipa pra-pemrosesan data yang rumit yang hanya sedikit meningkatkan akurasi,” kata Cohere dalam posting blog. “Embed 4 memecahkan masalah ini, memungkinkan perusahaan dan karyawannya untuk secara efisien memunculkan wawasan yang tersembunyi di dalam gunung -gunung informasi yang tidak dapat diteliti.”
Perusahaan dapat menggunakan Embed 4 pada awan swasta virtual atau tumpukan teknologi di tempat untuk keamanan data yang ditambahkan.
Perusahaan bisa menghasilkan embeddings untuk mengubah dokumen mereka atau data lain menjadi representasi numerik untuk Rag Use kasus. Agen kemudian dapat merujuk embeddings ini untuk menjawab petunjuk.
Pengetahuan khusus domain
Embed 4 “unggul dalam industri yang diatur” seperti keuangan, perawatan kesehatan dan manufaktur, kata perusahaan itu. Cohere, yang terutama berfokus pada kasus penggunaan AI perusahaan, mengatakan modelnya mempertimbangkan kebutuhan keamanan sektor yang diatur dan memiliki pemahaman yang kuat tentang bisnis.
Perusahaan yang melatih Embed 4 “menjadi kuat terhadap data dunia nyata yang bising” karena tetap akurat meskipun “ketidaksempurnaan” data perusahaan, seperti kesalahan ejaan dan masalah pemformatan.
“Ini juga kinerja dalam mencari dokumen yang dipindai dan tulisan tangan. Format ini umum dalam dokumen hukum, faktur asuransi, dan kwitansi pengeluaran. Kemampuan ini menghilangkan kebutuhan untuk persiapan data yang kompleks atau pipa pra-pemrosesan, menghemat waktu dan biaya operasional,” kata Cohere.
Organisasi dapat menggunakan Embed 4 untuk presentasi investor, file uji tuntas, laporan uji klinis, panduan perbaikan dan dokumen produk.
Model ini mendukung lebih dari 100 bahasa, seperti versi model sebelumnya.
Agora, pelanggan cohere, menggunakan Embed 4 untuk mesin pencari AI -nya dan menemukan bahwa model dapat memunculkan produk yang relevan.
“Data e-commerce kompleks, berisi gambar dan deskripsi teks beragam.
Kasus penggunaan agen
Cohere berpendapat bahwa model seperti Embed 4 akan meningkatkan kasus penggunaan agen dan mengklaim itu bisa menjadi “mesin pencari optimal” untuk agen dan asisten AI di seluruh perusahaan.
“Selain akurasi yang kuat di seluruh tipe data, model ini memberikan efisiensi tingkat perusahaan,” kata Cohere. “Ini memungkinkannya untuk memenuhi tuntutan organisasi besar.”
Cohere menambahkan bahwa Embed 4 membuat embedding data terkompresi untuk memotong biaya penyimpanan yang tinggi.
Embeddings dan pencarian berbasis RAG memungkinkan agen referensi dokumen spesifik untuk memenuhi tugas terkait permintaan. Banyak yang percaya ini memberikan hasil yang lebih akurat, memastikan agen tidak merespons dengan jawaban yang salah atau berhalusinasi.
Model-model penyematan lain yang bersaing dengan cohere termasuk qodo-embed-1-1.5b dan model dari Voyage AI, yang baru-baru ini didapat oleh vendor basis data MongoDB.