
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Qodo, platform kualitas kode yang digerakkan AI yang sebelumnya dikenal sebagai kodium, telah mengumumkan rilis qodo-embed-1-1.5b, model embedding kode open source baru yang memberikan kinerja canggih sementara secara signifikan lebih kecil dan lebih efisien daripada solusi yang bersaing.
Dirancang untuk meningkatkan pencarian kode, pengambilan, dan pemahaman, model parameter 1,5 miliar mencapai hasil tingkat atas pada tolok ukur industri, mengungguli model yang lebih besar dari OpenAI dan Salesforce.
Untuk tim pengembangan perusahaan yang mengelola basis kode yang luas dan kompleks, inovasi Qodo mewakili lompatan ke depan dalam alur kerja rekayasa perangkat lunak yang digerakkan AI. Dengan mengaktifkan pengambilan kode yang lebih akurat dan efisien, qodo-embed-1-1.5b mengatasi tantangan penting dalam pengembangan yang dibantu AI: kesadaran konteks dalam sistem perangkat lunak skala besar.
Mengapa Model Embedding Code Penting untuk Enterprise AI
Solusi pengkodean bertenaga AI secara tradisional berfokus pada pembuatan kode, dengan model bahasa besar (LLM) mendapatkan perhatian karena kemampuan mereka untuk menulis kode baru.
Namun, seperti ITamar Friedman, CEO dan co-founder Qodo, menjelaskan dalam wawancara panggilan video awal pekan ini: “Perangkat lunak perusahaan dapat memiliki puluhan juta, jika tidak ratusan juta, baris kode. Pembuatan kode saja tidak cukup – Anda perlu memastikan kodenya berkualitas tinggi, berfungsi dengan benar, dan terintegrasi dengan seluruh sistem. ”
Model embedding kode memainkan peran penting dalam pengembangan yang dibantu AI dengan memungkinkan sistem untuk mencari dan mengambil cuplikan kode yang relevan secara efisien. Ini sangat penting untuk organisasi besar di mana proyek perangkat lunak menjangkau jutaan baris kode di berbagai tim, repositori, dan bahasa pemrograman.
“Konteks adalah raja untuk apa pun saat ini terkait dengan membangun perangkat lunak dengan model,” kata Friedman. “Secara khusus, untuk mengambil konteks yang tepat dari basis kode yang sangat besar, Anda harus melalui beberapa mekanisme pencarian.”
Qodo-embed-1-1.5b memberikan kinerja dan efisiensi
Qodo-embed-1-1.5b menonjol karena keseimbangan efisiensi dan akurasinya. Sementara banyak model canggih mengandalkan miliaran parameter-teks-embedding-3-besar Openai memiliki 7 miliar, misalnya-model Qodo mencapai hasil yang unggul dengan hanya 1,5 miliar parameter.
Pada Benchmark Pengambilan Informasi Kode (COIR), tes standar industri untuk pengambilan kode di berbagai bahasa dan tugas, qodo-embed-1-1.5B mencetak 70,06, mengungguli SFR-Embedding-2_R Salesforce (67,41) dan OpenAI (65. 65.17).
Tingkat kinerja ini sangat penting untuk perusahaan yang mencari solusi AI yang hemat biaya. Dengan kemampuan untuk berjalan pada GPU berbiaya rendah, model ini membuat pengambilan kode canggih dapat diakses oleh tim pengembangan yang lebih luas, mengurangi biaya infrastruktur sambil meningkatkan kualitas dan produktivitas perangkat lunak.
Menangani kompleksitas, nuansa, dan kekhususan cuplikan kode yang berbeda
Salah satu tantangan terbesar dalam pengembangan perangkat lunak bertenaga AI adalah bahwa kode yang tampak serupa dapat memiliki fungsi yang sangat berbeda. Friedman mengilustrasikan ini dengan contoh yang sederhana namun berdampak:
“Salah satu tantangan terbesar dalam kode embedding adalah bahwa dua fungsi yang hampir identik – seperti 'penarikan' dan 'setoran' – mungkin hanya berbeda dengan tanda plus atau minus. Mereka harus dekat dalam ruang vektor tetapi juga jelas berbeda. ”
Masalah utama dalam model penyematan adalah memastikan bahwa kode yang berbeda secara fungsional tidak dikelompokkan secara tidak benar bersama -sama, yang dapat menyebabkan kesalahan perangkat lunak besar. “Anda memerlukan model penyematan yang memahami kode dengan cukup baik untuk mengambil konteks yang tepat tanpa membawa fungsi yang serupa tetapi salah, yang dapat menyebabkan masalah serius.”
Untuk menyelesaikan ini, Qodo mengembangkan pendekatan pelatihan yang unik, menggabungkan data sintetis berkualitas tinggi dengan sampel kode dunia nyata. Model ini dilatih untuk mengenali perbedaan yang bernuansa dalam kode yang serupa secara fungsional, memastikan bahwa ketika pengembang mencari kode yang relevan, sistem mengambil hasil yang tepat-bukan hanya yang tampak serupa.
Friedman mencatat bahwa proses pelatihan ini disempurnakan dalam kolaborasi dengan Nvidia dan AWS, keduanya menulis blog teknis tentang metodologi Qodo. “Kami mengumpulkan dataset unik yang mensimulasikan sifat halus pengembangan perangkat lunak dan menyempurnakan model untuk mengenali nuansa tersebut. Itu sebabnya model kami mengungguli model embedding generik untuk kode. “
Dukungan bahasa multi-pemrograman dan rencana untuk ekspansi di masa depan
Model qodo-embed-1-1.5b telah dioptimalkan untuk 10 besar bahasa pemrograman yang paling umum digunakan, termasuk Python, JavaScript, dan Java, dengan dukungan tambahan untuk ekor panjang bahasa dan kerangka kerja lain.
Iterasi model di masa depan akan berkembang di yayasan ini, menawarkan integrasi yang lebih dalam dengan alat pengembangan perusahaan dan dukungan bahasa tambahan.
“Banyak model penyematan berjuang untuk membedakan antara bahasa pemrograman, kadang -kadang mencampur cuplikan dari berbagai bahasa,” kata Friedman. “Kami secara khusus melatih model kami untuk mencegahnya, dengan fokus pada 10 bahasa teratas yang digunakan dalam pengembangan perusahaan.”
Opsi penyebaran perusahaan dan tersedia
Qodo membuat model barunya dapat diakses secara luas melalui beberapa saluran.
Versi parameter 1.5b tersedia untuk memeluk wajah di bawah lisensi OpenRail ++-M, yang memungkinkan pengembang untuk mengintegrasikannya ke dalam alur kerja mereka secara bebas. Perusahaan yang membutuhkan kemampuan tambahan dapat mengakses versi yang lebih besar di bawah lisensi komersial.
Untuk perusahaan yang mencari solusi yang dikelola sepenuhnya, Qodo menawarkan platform kelas perusahaan yang mengotomatisasi pembaruan yang menanamkan saat basis kode berkembang. Ini membahas tantangan utama dalam pengembangan yang digerakkan oleh AI: memastikan bahwa model pencarian dan pengambilan tetap akurat karena perubahan kode dari waktu ke waktu.
Friedman melihat ini sebagai langkah alami dalam misi Qodo. “Kami melepaskan qodo embed satu sebagai langkah pertama. Tujuan kami adalah untuk terus meningkatkan tiga dimensi – akurasi, dukungan untuk lebih banyak bahasa, dan penanganan kerangka kerja dan perpustakaan tertentu yang lebih baik. ”
Di luar memeluk wajah, model ini juga akan tersedia melalui platform NIM NVIDIA dan AWS Sagemaker Jumpstart, membuatnya lebih mudah bagi perusahaan untuk menggunakan dan mengintegrasikan ke dalam lingkungan pengembangan yang ada.
Masa depan AI di Perangkat Lunak Enterprise Dev
Alat pengkodean bertenaga AI berkembang pesat, tetapi fokusnya bergeser melampaui pembuatan kode ke arah pemahaman kode, pengambilan, dan jaminan kualitas. Ketika perusahaan bergerak untuk mengintegrasikan AI lebih dalam ke dalam proses rekayasa perangkat lunak mereka, alat-alat seperti qodo-embed-1-1.5b akan memainkan peran penting dalam membuat sistem AI lebih andal, efisien, dan hemat biaya.
“Jika Anda seorang pengembang di perusahaan Fortune 15.000, Anda tidak hanya menggunakan kopilot atau kursor. Anda memiliki alur kerja dan inisiatif internal yang membutuhkan pemahaman mendalam tentang basis kode besar. Di situlah model penyematan kode berkualitas tinggi menjadi penting. “
Model terbaru Qodo adalah langkah menuju masa depan di mana AI tidak hanya membantu pengembang dengan kode menulis-itu membantu mereka memahami, mengelola, dan mengoptimalkannya di seluruh ekosistem perangkat lunak skala besar yang kompleks.
Untuk tim perusahaan yang ingin memanfaatkan AI untuk pencarian kode yang lebih cerdas, pengambilan, dan kontrol kualitas, model embedding baru Qodo menawarkan alternatif kinerja yang menarik dan berkinerja tinggi untuk solusi yang lebih besar, lebih padat sumber daya.