
Bergabunglah dengan buletin harian dan mingguan kami untuk mendapatkan pembaruan terkini dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari Lebih Lanjut
Dorongan industri terhadap AI agen terus berlanjut, dengan Nvidia mengumumkan beberapa layanan dan model baru untuk memfasilitasi pembuatan dan penerapan agen AI.
Hari ini, Nvidia meluncurkan Nemotron, rangkaian model yang didasarkan pada Llama Meta dan dilatih tentang teknik dan kumpulan data perusahaan. Perusahaan juga mengumumkan cetak biru orkestrasi AI baru untuk memandu agen AI. Rilisan terbaru ini membawa Nvidia, perusahaan yang lebih dikenal dengan perangkat keras yang mendukung revolusi AI generatif, menjadi yang terdepan dalam pengembangan AI agen.
Nemotron hadir dalam tiga ukuran: Nano, Super dan Ultra. Ia juga hadir dalam dua versi: Llama Nemotron untuk tugas bahasa dan model visi Cosmos Nemotron untuk proyek AI fisik. Llama Nemotron Nano memiliki parameter 4B, parameter Super 49B dan parameter Ultra 253B.
Ketiganya bekerja paling baik untuk tugas-tugas agen termasuk “mengikuti instruksi, obrolan, pemanggilan fungsi, pengkodean dan matematika,” menurut perusahaan.
Rev Lebaredian, VP Omniverse dan teknologi simulasi di Nvidia, mengatakan dalam pengarahan dengan wartawan bahwa ketiga ukuran tersebut dioptimalkan untuk sumber daya komputasi Nvidia yang berbeda. Nano ditujukan untuk aplikasi latensi rendah yang hemat biaya pada PC dan perangkat edge, Super untuk akurasi dan throughput tinggi pada satu GPU, dan Ultra untuk akurasi tertinggi pada skala pusat data.
“Agen AI adalah tenaga kerja digital yang akan bekerja untuk kami dan bekerja bersama kami, sehingga rangkaian model Nemotron ditujukan untuk AI agen,” kata Lebaredian.
Model Nemotron tersedia sebagai API yang dihosting di Hugging Face dan situs web Nvidia. Nvidia mengatakan perusahaan dapat mengakses model tersebut melalui platform perangkat lunak AI Enterprise miliknya.
Nvidia tidak asing dengan model pondasi. Tahun lalu, mereka diam-diam merilis versi Nemotron, Llama-3.1-Nemotron-70B-Instruct, yang mengungguli model serupa dari OpenAI dan Anthropic. Mereka juga meluncurkan NVLM 1.0, sebuah keluarga model bahasa multimodal.
Lebih banyak dukungan untuk agen
Agen AI menjadi tren besar pada tahun 2024 ketika perusahaan mulai mengeksplorasi cara menerapkan sistem agen dalam alur kerja mereka. Banyak yang percaya bahwa momentum ini akan terus berlanjut tahun ini.
Perusahaan seperti Salesforce, ServiceNow, AWS, dan Microsoft menyebut agen sebagai generasi AI generasi berikutnya di perusahaan. AWS telah menambahkan orkestrasi multi-agen ke Bedrock, sementara Salesforce merilis Agentforce 2.0, menghadirkan lebih banyak agen ke pelanggannya.
Namun, alur kerja agen masih memerlukan infrastruktur lain agar dapat bekerja secara efisien. Salah satu infrastruktur tersebut berkisar pada orkestrasi, atau pengelolaan banyak agen yang melintasi sistem berbeda.
Cetak biru orkestrasi
Nvidia juga telah memasuki bidang orkestrasi AI yang sedang berkembang dengan cetak birunya yang memandu agen melalui tugas-tugas tertentu.
Perusahaan telah bermitra dengan beberapa perusahaan orkestrasi, termasuk LangChain, LlamaIndex, CrewAI, Daily dan Weights and Biases, untuk membangun cetak biru Nvidia AI Enterprise. Setiap kerangka orkestrasi telah mengembangkan cetak birunya sendiri dengan Nvidia. Misalnya, CrewAI membuat cetak biru untuk dokumentasi kode guna memastikan repositori kode mudah dinavigasi. LangChain menambahkan layanan mikro Nvidia NIM ke cetak biru pembuatan laporan terstrukturnya untuk membantu agen mengembalikan pencarian internet dalam format berbeda.
“Membuat banyak agen bekerja sama dengan lancar atau orkestrasi adalah kunci dalam penerapan AI agen,” kata Lebaredian. “Perusahaan orkestrasi AI terkemuka ini mengintegrasikan setiap blok bangunan agen Nvidia, NIM, Nemo, dan Cetak Biru dengan platform orkestrasi agen sumber terbuka mereka.”
Cetak biru PDF-ke-podcast baru Nvidia bertujuan untuk bersaing dengan NotebookLM Google dengan mengubah informasi dari PDF menjadi audio. Cetak biru baru lainnya akan membantu membangun agen untuk mencari dan meringkas video.
Lebaredian mengatakan Blueprints bertujuan untuk membantu pengembang menyebarkan agen AI dengan cepat. Untuk itu, Nvidia meluncurkan Nvidia Launchables, sebuah platform yang memungkinkan pengembang menguji, membuat prototipe, dan menjalankan cetak biru dalam satu klik.
Orkestrasi bisa menjadi salah satu cerita terbesar di tahun 2025 ketika perusahaan bergulat dengan produksi multi-agen.