
Bergabunglah dengan acara yang dipercaya oleh para pemimpin perusahaan selama hampir dua dekade. VB Transform menyatukan orang -orang yang membangun strategi AI perusahaan nyata. Pelajari lebih lanjut
Scott White masih mengagumi betapa cepatnya kecerdasan buatan telah berubah dari kebaruan menjadi mitra kerja sejati. Lebih dari setahun yang lalu, pimpinan produk untuk Claude AI di Anthropic menyaksikan alat pengkodean AI awal hampir tidak bisa menyelesaikan satu baris kode. Hari ini, dia membangun fitur perangkat lunak yang siap diproduksi sendiri-meskipun bukan programmer profesional.
“Saya tidak lagi menganggap pekerjaan saya sebagai menulis PRD dan mencoba meyakinkan seseorang untuk melakukan sesuatu,” kata White saat mengobrol dengan api unggun di VB Transform 2025KTT AI Enterprise tahunan VentureBeat di San Francisco. “Hal pertama yang saya lakukan adalah, dapatkah saya membangun prototipe yang bisa diterapkan dari ini di server pementasan kami dan kemudian membagikan demo itu benar -benar berfungsi.”
Pergeseran ini mewakili transformasi yang lebih luas dalam bagaimana perusahaan mengadopsi AI, bergerak melampaui chatbots sederhana yang menjawab pertanyaan untuk sistem “agen” yang canggih yang mampu melakukan pekerjaan otonom. Pengalaman White menawarkan sekilas tentang apa yang mungkin akan datang bagi jutaan pekerja pengetahuan lainnya.
Dari penyelesaian kode hingga pemrograman otonom: evolusi sangat tinggi AI
Evolusi sangat cepat. Ketika White bergabung dengan antropik, model Claude 2 perusahaan dapat menangani penyelesaian teks dasar. Rilis Claude 3.5 Sonnet memungkinkan pembuatan seluruh aplikasi, yang mengarah ke fitur -fitur seperti artefak yang memungkinkan pengguna menghasilkan antarmuka khusus. Sekarang, dengan Claude 4 mencapai skor 72,5% pada tolok ukur pengkodean SWE-Bench, model ini dapat berfungsi sebagai apa yang disebut White “insinyur perangkat lunak agen yang sepenuhnya jauh.”
Claude Code, alat pengkodean terbaru perusahaan, dapat menganalisis seluruh basis kode, mencari di internet untuk dokumentasi API, menerbitkan permintaan tarik, menanggapi komentar tinjauan kode, dan mengulangi solusi – semuanya saat bekerja secara tidak sinkron selama berjam -jam. White mencatat bahwa 90% kode Claude itu sendiri ditulis oleh sistem AI.
“Itu seperti seluruh proses agen di latar belakang yang tidak mungkin enam bulan lalu,” White menjelaskan.
Perusahaan raksasa memangkas waktu kerja dari minggu ke menit dengan agen AI
Implikasinya jauh melampaui pengembangan perangkat lunak. Novo Nordisk, raksasa farmasi Denmark, telah mengintegrasikan Claude ke dalam alur kerja yang sebelumnya memakan waktu 10 minggu untuk menyelesaikan laporan klinis, sekarang menyelesaikan pekerjaan yang sama dalam 10 menit. Gitlab menggunakan teknologi untuk segala hal mulai dari proposal penjualan hingga dokumentasi teknis. Intuit menyebarkan Claude untuk memberikan saran pajak langsung kepada konsumen.
White membedakan antara berbagai tingkat integrasi AI: model bahasa sederhana yang menjawab pertanyaan, model yang ditingkatkan dengan alat -alat seperti pencarian web, alur kerja terstruktur yang menggabungkan AI ke dalam proses bisnis, dan agen penuh yang dapat mengejar tujuan secara mandiri menggunakan banyak alat dan penalaran berulang.
“Saya berpikir tentang agen sebagai sesuatu yang memiliki tujuan, dan kemudian itu bisa melakukan banyak hal untuk mencapai tujuan itu,” kata White. Enabler utama adalah apa yang ia sebut hubungan “tak terhindarkan” antara model intelijen dan kemampuan produk baru.
Revolusi Infrastruktur: Membangun Jaringan Kolaborator AI
Pengembangan infrastruktur yang kritis telah menjadi model konteks model Anthropic Protocol (MCP), yang White gambarkan sebagai “USB-C untuk integrasi.” Daripada perusahaan yang membangun koneksi terpisah ke setiap sumber atau alat data, MCP menyediakan cara standar bagi sistem AI untuk mengakses perangkat lunak perusahaan, dari Salesforce hingga repositori pengetahuan internal.
“Ini benar-benar mendemokratisasi akses ke data,” kata White, mencatat bahwa integrasi yang dibangun oleh satu perusahaan dapat dibagikan dan digunakan kembali oleh orang lain melalui protokol open-source.
Untuk organisasi yang ingin mengimplementasikan agen AI, White merekomendasikan untuk memulai dari yang kecil dan membangun secara bertahap. “Jangan mencoba membangun seluruh sistem agen dari awal,” sarannya. “Bangun komponennya, pastikan komponen itu berfungsi, lalu bangun komponen berikutnya.”
Dia juga menekankan pentingnya sistem evaluasi untuk memastikan agen AI berkinerja sebagaimana dimaksud. “Eval adalah PRD baru,” kata White, merujuk pada dokumen persyaratan produk, menyoroti bagaimana perusahaan harus mengembangkan metode baru untuk menilai kinerja AI pada tugas bisnis tertentu.
Dari AI Assistants ke AI Organisasi: Perbatasan Tenaga Kerja Berikutnya
Ke depan, White membayangkan pengembangan AI menjadi dapat diakses oleh pekerja non-teknis, mirip dengan bagaimana kemampuan pengkodean telah maju. Dia membayangkan masa depan di mana individu mengelola tidak hanya satu agen AI tetapi seluruh organisasi sistem AI khusus.
“Bagaimana semua orang bisa menjadi CPO atau CEO mini mereka sendiri?” White bertanya. “Aku tidak tahu persis seperti apa itu, tapi itulah hal yang aku bangun dan ingin sampai di sana.”
Transformasi yang dijelaskan White mencerminkan tren industri yang lebih luas karena perusahaan bergulat dengan kemampuan AI yang berkembang. Sementara adopsi awal berfokus pada kasus penggunaan eksperimental, perusahaan semakin mengintegrasikan AI ke dalam proses bisnis inti, secara fundamental mengubah cara kerja dilakukan.
Ketika agen AI menjadi lebih otonom dan mampu, tantangan bergeser dari mesin pengajaran untuk melakukan tugas ke mengelola kolaborator AI yang dapat bekerja secara mandiri untuk waktu yang lama. Untuk kulit putih, masa depan ini sudah tiba – satu fitur produksi sekaligus.