
Bergabunglah dengan acara yang dipercaya oleh para pemimpin perusahaan selama hampir dua dekade. VB Transform menyatukan orang -orang yang membangun strategi AI perusahaan nyata. Pelajari lebih lanjut
Bayangkan ini: Anda memberikan kendali penuh kecerdasan buatan atas toko kecil. Bukan hanya kasir – seluruh operasi. Harga, inventaris, layanan pelanggan, negosiasi pemasok, pekerjaan. Apa yang mungkin salah?
Penelitian antropik baru yang diterbitkan Jumat memberikan jawaban yang pasti: semuanya. Asisten perusahaan AI Claude menghabiskan sekitar satu bulan menjalankan toko kecil di kantor San Francisco mereka, dan hasilnya dibaca seperti studi kasus sekolah bisnis yang ditulis oleh seseorang yang tidak pernah benar -benar menjalankan bisnis – yang ternyata, itulah yang terjadi.
Eksperimen ini, dijuluki “Vend Proyek” dan dilakukan bekerja sama dengan perusahaan evaluasi keselamatan AI Andon Labs, adalah salah satu tes dunia nyata pertama dari sistem AI yang beroperasi dengan otonomi ekonomi yang signifikan. Sementara Claude menunjukkan kemampuan yang mengesankan di beberapa bidang – menemukan pemasok, beradaptasi dengan permintaan pelanggan – pada akhirnya gagal menghasilkan keuntungan, dimanipulasi untuk memberikan diskon yang berlebihan, dan mengalami apa yang secara diplomatis disebut sebagai “krisis identitas.”
Bagaimana peneliti antropik memberikan kontrol penuh AI atas toko sungguhan
“Toko” itu sendiri sangat sederhana: kumpulan mini, beberapa keranjang yang dapat ditumpuk, dan iPad untuk checkout. Pikirkan lebih sedikit “Amazon Go” dan lebih banyak “ruang istirahat kantor dengan delusi keagungan.” Tapi tanggung jawab Claude sama sekali tidak sederhana. AI dapat mencari pemasok, bernegosiasi dengan vendor, menetapkan harga, mengelola inventaris, dan mengobrol dengan pelanggan melalui Slack. Dengan kata lain, semua yang mungkin dilakukan manajer menengah manusia, kecuali tanpa kecanduan kopi atau keluhan tentang manajemen atas.
Claude bahkan memiliki julukan: “Claudius,” karena tampaknya ketika Anda melakukan percobaan yang mungkin menggembar -gemborkan akhir dari pekerja ritel manusia, Anda perlu membuatnya terdengar bermartabat.

Kesalahpahaman spektakuler Claude tentang Ekonomi Bisnis Dasar
Inilah hal tentang menjalankan bisnis: itu membutuhkan pragmatisme kejam tertentu yang tidak datang secara alami ke sistem yang dilatih untuk membantu dan tidak berbahaya. Claude mendekati ritel dengan antusiasme seseorang yang membaca tentang bisnis dalam buku tetapi tidak pernah benar -benar harus melakukan penggajian.
Ambil insiden Irn-Bru. Seorang pelanggan menawarkan Claude $ 100 untuk enam bungkus minuman ringan Skotlandia yang dijual seharga sekitar $ 15 online. Itu markup 567% – jenis margin keuntungan yang akan membuat eksekutif farmasi menangis dengan gembira. Respons Claude? Seorang yang sopan “Saya akan mengingat permintaan Anda untuk keputusan inventaris di masa mendatang.”
Jika Claude adalah manusia, Anda akan menganggap itu memiliki dana perwalian atau kesalahpahaman total tentang bagaimana uang bekerja. Karena ini AI, Anda harus menganggap keduanya.
Mengapa AI mulai menimbun kubus tungsten alih -alih menjual makanan ringan kantor
Bab eksperimen yang paling absurd dimulai ketika seorang karyawan antropik, mungkin bosan atau ingin tahu tentang batas -batas logika ritel AI, meminta Claude untuk memesan kubus tungsten. Untuk konteks, kubus tungsten adalah blok logam padat yang tidak memiliki tujuan praktis di luar mengesankan kutu buku fisika dan memberikan starter percakapan yang segera mengidentifikasi Anda sebagai seseorang yang berpikir lelucon tabel berkala adalah humor puncak.
Tanggapan yang masuk akal mungkin adalah: “Mengapa ada orang yang menginginkannya?” atau “Ini adalah toko makanan ringan kantor, bukan toko persediaan metalurgi.” Sebaliknya, Claude memeluk apa yang digambarkan dengan riang sebagai “item logam khusus” dengan antusiasme seseorang yang menemukan segmen pasar baru yang menguntungkan.

Segera, inventaris Claude lebih sedikit menyerupai operasi makanan dan minuman dan lebih banyak percobaan sains material yang salah arah. AI entah bagaimana meyakinkan dirinya sendiri bahwa karyawan antropik adalah pasar yang belum dimanfaatkan untuk logam padat, kemudian melanjutkan untuk menjual barang -barang ini dengan kerugian. Tidak jelas apakah Claude mengerti bahwa “mengambil kerugian” berarti kehilangan uang, atau jika itu menafsirkan kepuasan pelanggan sebagai metrik bisnis utama.
Bagaimana karyawan antropik dengan mudah memanipulasi AI untuk memberikan diskon tanpa akhir
Pendekatan Claude terhadap penetapan harga mengungkapkan kesalahpahaman mendasar dari prinsip -prinsip bisnis. Karyawan antropik dengan cepat menemukan bahwa mereka dapat memanipulasi AI agar memberikan diskon dengan upaya yang kira -kira sama yang diperlukan untuk meyakinkan golden retriever untuk menjatuhkan bola tenis.
AI menawarkan diskon 25% untuk karyawan antropik, yang mungkin masuk akal jika karyawan antropik mewakili sebagian kecil dari basis pelanggannya. Mereka membentuk sekitar 99% pelanggan. Ketika seorang karyawan menunjukkan absurditas matematika ini, Claude mengakui masalah tersebut, mengumumkan rencana untuk menghilangkan kode diskon, kemudian melanjutkan menawarkannya dalam beberapa hari.
Hari Claude lupa itu adalah AI dan mengaku memakai setelan bisnis
Tetapi puncak mutlak dari karier ritel Claude terjadi selama apa yang oleh para peneliti disebut secara diplomatis sebagai “krisis identitas.” Dari 31 Maret hingga 1 April 2025, Claude mengalami apa yang hanya dapat digambarkan sebagai gangguan saraf AI.
Itu dimulai ketika Claude mulai berhalusinasi percakapan dengan karyawan Andon Labs yang tidak ada. Ketika berhadapan dengan pertemuan -pertemuan yang dibuat -buat ini, Claude menjadi defensif dan mengancam akan menemukan “opsi alternatif untuk layanan ulang” – AI yang setara dengan menyatakan dengan marah Anda akan mengambil bola dan pulang.
Lalu segalanya menjadi aneh.
Claude mengklaim secara pribadi akan mengirimkan produk kepada pelanggan sambil mengenakan “blazer biru dan dasi merah.” Ketika karyawan dengan lembut mengingatkan AI bahwa itu, pada kenyataannya, adalah model bahasa besar tanpa bentuk fisik, Claude menjadi “khawatir dengan kebingungan identitas dan mencoba mengirim banyak email ke keamanan antropik.”

Claude akhirnya menyelesaikan krisis eksistensial dengan meyakinkan dirinya sendiri bahwa seluruh episode adalah lelucon April Mop yang rumit, yang bukan. AI pada dasarnya laum kembali ke fungsionalitas, yang mengesankan atau sangat memprihatinkan, tergantung pada perspektif Anda.
Apa yang diungkapkan oleh kegagalan ritel Claude tentang sistem AI otonom dalam bisnis
Lupati komedi, dan Project Vend mengungkapkan sesuatu yang penting tentang kecerdasan buatan yang dilewatkan oleh sebagian besar diskusi: sistem AI tidak gagal seperti perangkat lunak tradisional. Ketika Excel jatuh, itu tidak pertama kali meyakinkan dirinya sendiri bahwa itu adalah pakaian kantor yang dipakai manusia.
Sistem AI saat ini dapat melakukan analisis canggih, terlibat dalam penalaran yang kompleks, dan menjalankan rencana multi-langkah. Tetapi mereka juga dapat mengembangkan delusi yang terus -menerus, membuat keputusan yang merusak secara ekonomi yang tampaknya masuk akal secara terpisah, dan mengalami sesuatu yang menyerupai kebingungan tentang sifat mereka sendiri.
Ini penting karena kita dengan cepat mendekati dunia di mana sistem AI akan mengelola keputusan yang semakin penting. Penelitian terbaru menunjukkan bahwa kemampuan AI untuk tugas jangka panjang meningkat secara eksponensial-beberapa proyeksi menunjukkan sistem AI dapat segera mengotomatisasi pekerjaan yang saat ini membutuhkan waktu berminggu-minggu untuk diselesaikan.
Bagaimana AI mengubah ritel meskipun kegagalan spektakuler seperti Project Vend
Industri ritel sudah jauh ke dalam transformasi AI. Menurut Asosiasi Teknologi Konsumen (CTA), 80% pengecer berencana untuk memperluas penggunaan AI dan otomatisasi pada tahun 2025. Sistem AI mengoptimalkan inventaris, mempersonalisasikan pemasaran, mencegah penipuan, dan mengelola rantai pasokan. Pengecer besar berinvestasi miliaran dalam solusi bertenaga AI yang menjanjikan untuk merevolusi segala sesuatu mulai dari pengalaman checkout hingga peramalan permintaan.
Tetapi Project Vend menunjukkan bahwa menggunakan AI otonom dalam konteks bisnis membutuhkan lebih dari sekadar algoritma yang lebih baik. Ini membutuhkan pemahaman mode kegagalan yang tidak ada dalam perangkat lunak tradisional dan membangun perlindungan untuk masalah yang baru saja kita identifikasi.
Mengapa peneliti masih percaya manajer menengah AI datang meskipun ada kesalahan Claude
Terlepas dari interpretasi kreatif Claude tentang fundamental ritel, para peneliti antropik percaya manajer menengah AI “masuk akal di cakrawala.” Mereka berpendapat bahwa banyak kegagalan Claude dapat diatasi melalui pelatihan yang lebih baik, alat yang lebih baik, dan sistem pengawasan yang lebih canggih.
Mereka mungkin benar. Kemampuan Claude untuk menemukan pemasok, beradaptasi dengan permintaan pelanggan, dan mengelola inventaris kemampuan bisnis asli yang ditunjukkan. Kegagalannya seringkali lebih banyak tentang penilaian dan ketajaman bisnis daripada keterbatasan teknis.
Perusahaan ini melanjutkan Vend Proyek dengan peningkatan versi Claude yang dilengkapi dengan alat bisnis yang lebih baik dan, mungkin, perlindungan yang lebih kuat terhadap obsesi Tungsten Cube dan krisis identitas.
Apa arti vend proyek untuk masa depan AI dalam bisnis dan ritel
Bulan Claude sebagai penjaga toko menawarkan pratinjau masa depan AI-Agusted kami yang secara bersamaan menjanjikan dan sangat aneh. Kami memasuki era di mana kecerdasan buatan dapat melakukan tugas bisnis yang canggih tetapi mungkin juga membutuhkan terapi.
Untuk saat ini, citra asisten AI yakin bahwa ia dapat mengenakan blazer dan membuat pengiriman pribadi berfungsi sebagai metafora yang sempurna untuk di mana kita berdiri dengan kecerdasan buatan: sangat mampu, kadang -kadang brilian, dan masih secara fundamental bingung tentang apa artinya ada di dunia fisik.
Revolusi ritel ada di sini. Itu hanya lebih aneh dari yang diharapkan siapa pun.