
Bergabunglah dengan acara yang dipercaya oleh para pemimpin perusahaan selama hampir dua dekade. VB Transform menyatukan orang -orang yang membangun strategi AI perusahaan nyata. Pelajari lebih lanjut
Perusahaan yang ingin membangun dan skala agen juga perlu merangkul kenyataan lain: agen tidak dibangun seperti perangkat lunak lainnya.
Agen “berbeda secara kategoris” dalam cara mereka dibangun, bagaimana mereka beroperasi, dan bagaimana mereka ditingkatkan, menurut CEO dan pendiri penulis May Habib. Ini berarti membuang siklus hidup pengembangan perangkat lunak tradisional saat berhadapan dengan sistem adaptif.
“Agen tidak andal mengikuti aturan,” kata Habib pada hari Rabu saat berada di panggung di VB Transform. “Mereka didorong oleh hasil. Mereka menafsirkan. Mereka beradaptasi. Dan perilaku itu benar-benar hanya muncul di lingkungan dunia nyata.”
Mengetahui apa yang berhasil-dan apa yang tidak berhasil-berasal dari pengalaman Habib membantu ratusan klien perusahaan membangun dan skala agen kelas perusahaan. Menurut Habib, lebih dari 350 Fortune 1000 adalah pelanggan penulis, dan lebih dari setengah Fortune 500 akan menjadi agen penskalaan dengan penulis pada akhir 2025.
Menggunakan teknologi non-deterministik untuk menghasilkan output yang kuat bahkan dapat menjadi “benar-benar mimpi buruk,” kata Habib-terutama ketika mencoba skala agen secara sistemik. Bahkan jika tim perusahaan dapat memutar agen tanpa manajer dan desainer produk, Habib berpikir “pola pikir PM” masih diperlukan untuk berkolaborasi, membangun, mengulangi dan memelihara agen.
“Sayangnya atau untungnya, tergantung pada perspektif Anda, itu akan dibiarkan memegang tas jika mereka tidak memimpin rekan bisnis mereka ke cara membangun yang baru.”
>> lihat semua liputan transformasi 2025 kami di siniMengapa agen berbasis tujuan adalah pendekatan yang tepat
Salah satu pergeseran dalam pemikiran termasuk memahami sifat agen berbasis hasil. Misalnya, dia mengatakan bahwa banyak pelanggan meminta agen untuk membantu tim hukum mereka dalam meninjau atau mengubah kontrak. Tapi itu terlalu terbuka. Sebaliknya, pendekatan yang berorientasi pada tujuan berarti merancang agen untuk mengurangi waktu yang dihabiskan untuk meninjau dan mengganti kontrak.
“Dalam siklus hidup pengembangan perangkat lunak tradisional, Anda merancang untuk set deterministik langkah yang sangat dapat diprediksi,” kata Habib. “Ini masukan, masukan dengan cara yang lebih deterministik. Tetapi dengan agen, Anda berusaha untuk membentuk perilaku agen. Jadi Anda mencari lebih sedikit aliran yang terkontrol dan lebih banyak lagi untuk memberikan konteks dan memandu pengambilan keputusan oleh agen.”
Perbedaan lainnya adalah membangun cetak biru untuk agen yang menginstruksikan mereka dengan logika bisnis, daripada memberikan mereka alur kerja untuk diikuti. Ini termasuk merancang loop penalaran dan berkolaborasi dengan para ahli subjek untuk memetakan proses yang mempromosikan perilaku yang diinginkan.
Meskipun ada banyak pembicaraan tentang agen penskalaan, penulis masih membantu sebagian besar klien dengan membangun satu per satu. Itu karena penting pertama untuk menjawab pertanyaan tentang siapa yang memiliki dan mengaudit agen, yang memastikan itu tetap relevan dan masih memeriksa apakah itu masih menghasilkan hasil yang diinginkan.
“Ada tebing penskalaan yang orang -orang dapatkan dengan sangat, sangat cepat tanpa pendekatan baru untuk membangun dan menskalakan agen,” kata Habib. “Ada tebing yang akan dilakukan orang ketika kemampuan organisasi mereka untuk mengelola agen secara bertanggung jawab benar -benar melampaui laju pembangunan yang terjadi di departemen oleh departemen.”
QA untuk agen vs perangkat lunak
Jaminan kualitas juga berbeda untuk agen. Alih-alih daftar periksa obyektif, evaluasi agen mencakup akuntansi untuk perilaku non-biner dan menilai bagaimana agen bertindak dalam situasi dunia nyata. Itu karena kegagalan tidak selalu jelas – dan tidak hitam dan putih seperti memeriksa jika ada sesuatu yang pecah. Sebaliknya, Habib mengatakan lebih baik untuk memeriksa apakah agen berperilaku baik, menanyakan apakah gagal-safe bekerja, mengevaluasi hasil dan niat: “Tujuannya di sini bukanlah kesempurnaan itu adalah kepercayaan diri perilaku, karena ada banyak subjektivitas di sini di sini.”
Bisnis yang tidak memahami pentingnya iterasi pada akhirnya bermain “permainan tenis yang konstan yang baru saja melelahkan masing -masing sisi sampai mereka tidak ingin bermain lagi,” kata Habib. Penting juga bagi tim untuk baik -baik saja dengan agen yang kurang sempurna dan lebih tentang “meluncurkannya dengan aman dan berlari cepat dan berulang kali berulang kali.”
Terlepas dari tantangan, ada contoh agen AI yang sudah membantu membawa pendapatan baru untuk bisnis perusahaan. Sebagai contoh, Habib menyebutkan bank besar yang berkolaborasi dengan penulis untuk mengembangkan sistem berbasis agen, yang menghasilkan pipa Upsell baru senilai $ 600 juta dengan onboarding pelanggan baru ke berbagai lini produk.
Kontrol versi baru untuk agen AI
Pemeliharaan agen juga berbeda. Pemeliharaan perangkat lunak tradisional melibatkan memeriksa kode ketika sesuatu rusak, tetapi Habib mengatakan agen AI membutuhkan jenis kontrol versi baru untuk segala sesuatu yang dapat membentuk perilaku. Ini juga membutuhkan tata kelola yang tepat dan memastikan bahwa agen tetap berguna dari waktu ke waktu, daripada mengeluarkan biaya yang tidak perlu.
Karena model tidak memetakan dengan bersih ke agen AI, Habib mengatakan pemeliharaan termasuk memeriksa petunjuk, pengaturan model, skema alat, dan konfigurasi memori. Ini juga berarti melacak eksekusi sepenuhnya di seluruh input, output, langkah penalaran, panggilan alat dan interaksi manusia.
“Anda dapat memperbarui a [large language model] LLM Prompt dan saksikan agen berperilaku sama sekali berbeda meskipun tidak ada dalam sejarah git yang benar -benar berubah, “kata Habib.” Model tautan bergeser, indeks pengambilan diperbarui, API alat berkembang dan tiba -tiba prompt yang sama tidak berperilaku seperti yang diharapkan … rasanya seperti kita men -debug hantu. “