
Bergabunglah dengan buletin harian dan mingguan kami untuk mendapatkan pembaruan terkini dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari Lebih Lanjut
Nvidia hari ini meluncurkan Cetak Biru untuk Agen AI yang dapat menganalisis video sebagai bagian dari pidato pembuka CES 2025 yang dibawakan oleh CEO Jensen Huang.
Cetak Biru AI Nvidia baru yang didukung oleh Metropolis memungkinkan organisasi dan individu meningkatkan produktivitas dan keselamatan, dan bahkan dapat membantu CEO Nvidia meningkatkan kemampuan fastball-nya.
Momen besar berikutnya dalam AI sudah di depan mata — secara harfiah.
Saat ini, lebih dari 1,5 miliar kamera tingkat perusahaan yang digunakan di seluruh dunia menghasilkan sekitar 7 triliun jam video per tahun. Namun, hanya sebagian kecil saja yang dianalisis.
Diperkirakan kurang dari 1% video dari kamera industri ditonton langsung oleh manusia, sehingga insiden operasional penting bisa saja luput dari perhatian.
Hal ini membutuhkan biaya yang tinggi. Misalnya saja, produsen mengalami kerugian triliunan dolar setiap tahunnya karena kualitas produk yang buruk atau cacat yang mungkin mereka ketahui sebelumnya, atau bahkan diprediksi, dengan menggunakan agen AI yang dapat memahami, menganalisis, dan membantu manusia mengambil tindakan.
Agen AI interaktif dengan kemampuan persepsi visual bawaan dapat berfungsi sebagai
analis video yang selalu aktif, membantu pabrik berjalan lebih efisien, meningkatkan keselamatan pekerja, memantau segala sesuatunya berjalan lancar, dan bahkan meningkatkan kinerja atlet.
Untuk mempercepat pembuatan agen tersebut, Nvidia hari ini mengumumkan akses awal ke
versi baru Cetak Biru Nvidia AI untuk pencarian dan ringkasan video. Dibangun di atas platform Nvidia Metropolis — dan kini dilengkapi dengan model bahasa visi (VLM) Nvidia Cosmos Nemotron, model bahasa besar (LLM) Nvidia Llama Nemotron, dan Nvidia NeMo Retriever — cetak biru ini menyediakan alat bagi pengembang untuk membangun dan menerapkan agen AI yang dapat menganalisis konten video dan gambar dalam jumlah besar.
Cetak birunya mengintegrasikan platform perangkat lunak Nvidia AI Enterprise — yang
mencakup layanan mikro Nvidia NIM untuk VLM, LLM, dan kerangka AI tingkat lanjut untuk generasi pengambilan-tambahan — untuk memungkinkan pemrosesan video batch yang 30 kali lebih cepat daripada menontonnya secara real-time.
Cetak biru tersebut berisi beberapa fitur AI agen – seperti penalaran rantai pemikiran, perencanaan tugas, dan pemanggilan alat – yang dapat membantu pengembang menyederhanakan pembuatan agen visual yang kuat dan beragam untuk memecahkan berbagai masalah.
Agen AI dengan kemampuan analisis video dapat digabungkan dengan agen lain dengan keahlian berbeda untuk memungkinkan layanan AI agen yang lebih canggih.
Perusahaan memiliki fleksibilitas untuk membangun dan menerapkan agen AI mereka dari edge hingga cloud.
Bagaimana Agen AI Analis Video Dapat Membantu Bisnis Industri
Agen AI dengan persepsi visual dan keterampilan analisis dapat disesuaikan untuk membantu bisnis dalam operasi industri dengan:
● Meningkatkan produktivitas dan mengurangi limbah: Agen dapat membantu memastikannya
prosedur operasi standar diikuti selama industri yang kompleks
proses seperti perakitan produk. Mereka juga dapat disetel dengan cermat
perhatikan dan pahami berbagai tindakan, dan urutan tindakan tersebut
dilaksanakan.
● Meningkatkan efisiensi pengelolaan aset melalui pemanfaatan ruang yang lebih baik:
Agen dapat membantu mengoptimalkan penyimpanan inventaris di gudang dengan melakukan 3D
estimasi volume dan memusatkan pemahaman di berbagai kamera
sungai.
● Meningkatkan keselamatan melalui pembuatan laporan insiden secara otomatis dan
ringkasan: Agen dapat memproses video dalam jumlah besar dan merangkumnya menjadi laporan kecelakaan yang informatif dan kontekstual. Mereka juga dapat membantu memastikan
kepatuhan alat pelindung diri di pabrik, meningkatkan pekerja
keselamatan di lingkungan industri.
● Mencegah kecelakaan dan masalah produksi: Agen AI dapat mengidentifikasi
aktivitas yang tidak biasa untuk memitigasi risiko operasional dan keselamatan dengan cepat, baik dalam a
gudang, pabrik atau bandara, atau di persimpangan atau lingkungan kota lainnya.
● Belajar dari masa lalu: Agen dapat mencari melalui video operasi
arsip, dan informasi relevan dari masa lalu dan menggunakannya untuk memecahkan masalah atau membuat proses baru.
Analis Video untuk Olahraga, Hiburan, dan Lainnya
Industri lain yang menjadi tempat keberhasilan agen analisis video AI adalah olahraga — pasar senilai $500 miliar di seluruh dunia, dengan proyeksi pertumbuhan ratusan miliar selama beberapa tahun ke depan.
Pelatih, tim, dan liga — baik profesional maupun amatir — mengandalkan analisis video untuk mengevaluasi dan meningkatkan kinerja pemain, memprioritaskan keselamatan, dan meningkatkan keterlibatan penggemar melalui platform analisis pemain dan visualisasi data. Dengan agen AI yang peka secara visual, para atlet kini memiliki akses yang belum pernah ada sebelumnya terhadap wawasan yang lebih dalam dan peluang untuk berkembang.
Selama pidato pembukaan CES, Huang dari Nvidia mendemonstrasikan agen analisis video AI yang menilai keterampilan melempar bola cepat seorang pemain bisbol amatir dibandingkan dengan seorang profesional. Menggunakan video yang diambil
dari upacara lemparan pertama yang dilakukan Huang untuk San Francisco Giants
tim bisbol, agen AI analisis video dapat menyarankan area tersebut
peningkatan.
Industri media dan hiburan senilai $3 triliun juga siap menerima manfaat dari agen AI analis video. Melalui inisiatif Nvidia Media2, agen-agen ini akan membantu mendorong pembuatan konten yang lebih cerdas, lebih disesuaikan, dan lebih berdampak yang dapat beradaptasi dengan preferensi pemirsa individu.
Adopsi dan Ketersediaan di Seluruh Dunia
Mitra dari seluruh dunia sedang mengintegrasikan cetak biru untuk membangun agen AI untuk analisis video ke dalam alur kerja pengembang mereka, termasuk Accenture, Infosys, Linker Vision, Pegatron, TATA Consultancy Services (TCS), Telit Cinterion, dan VAST.