
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Antropik baru saja menembakkan tembakan peringatan di Openai, Deepseek dan seluruh industri AI dengan peluncuran Claude 3.7 Sonnet, sebuah model yang memberi pengguna kontrol yang belum pernah terjadi sebelumnya atas berapa banyak waktu yang dihabiskan AI “pemikiran” sebelum menghasilkan respons. Rilis, di samping debut Claude Code, agen pengkodean AI baris perintah, menandakan dorongan agresif Anthropic ke pasar AI perusahaan-dorongan yang dapat membentuk kembali bagaimana bisnis membangun perangkat lunak dan mengotomatiskan pekerjaan.
Taruhannya tidak bisa lebih tinggi. Bulan lalu, Deepseek mengejutkan dunia teknologi dengan model AI yang cocok dengan kemampuan sistem AS dengan sedikit biaya, mengirimkan saham Nvidia turun 17% dan meningkatkan alarm tentang kepemimpinan AI Amerika. Sekarang antropik bertaruh bahwa kontrol yang tepat atas penalaran AI – bukan hanya kecepatan mentah atau penghematan biaya – akan memberikan keunggulan.
“Kami hanya percaya bahwa penalaran adalah bagian inti dan komponen inti dari AI, daripada hal terpisah yang harus Anda bayar secara terpisah untuk diakses,” kata Dianne Penn, yang memimpin manajemen produk untuk penelitian di Antropik, dalam sebuah wawancara dengan VentureBeatic . “Sama seperti manusia, AI harus menangani respons cepat dan pemikiran kompleks. Untuk pertanyaan sederhana seperti 'Jam berapa sekarang?', Itu harus menjawab secara instan. Tetapi untuk tugas-tugas yang rumit-seperti merencanakan perjalanan Italia dua minggu sambil mengakomodasi kebutuhan diet bebas gluten-perlu waktu pemrosesan yang lebih luas. ”
“Kami tidak melihat penalaran, perencanaan, dan koreksi diri sebagai kemampuan terpisah,” tambahnya. “Jadi ini pada dasarnya adalah cara kami untuk mengungkapkan perbedaan filosofis … idealnya, model itu sendiri harus mengenali ketika suatu masalah membutuhkan pemikiran dan menyesuaikan yang lebih intensif, daripada mengharuskan pengguna untuk secara eksplisit memilih mode penalaran yang berbeda.”

Data benchmark mendukung visi ambisius Anthropic. Dalam Mode Berpikir Perpanjangan, Claude 3.7 Sonnet mencapai akurasi 78,2% pada tugas penalaran tingkat pascasarjana, menantang model terbaru Openai dan mengungguli Deepseek-R1.
Tetapi metrik yang lebih terbuka berasal dari aplikasi dunia nyata. Model skor 81,2% pada penggunaan alat yang berfokus pada ritel dan menunjukkan peningkatan yang nyata dalam pengikut instruksi (93,2%)-bidang di mana pesaing telah berjuang atau belum menerbitkan hasil.
Sementara Deepseek dan Openai memimpin dalam tolok ukur matematika tradisional, pendekatan terpadu Claude 3.7 menunjukkan bahwa model tunggal dapat secara efektif beralih antara respons cepat dan analisis mendalam, berpotensi menghilangkan kebutuhan bagi bisnis untuk mempertahankan sistem AI terpisah untuk berbagai jenis tugas.
Bagaimana AI hibrida antropik dapat membentuk kembali komputasi perusahaan
Waktu rilis sangat penting. Kemunculan Deepseek bulan lalu mengirim gelombang kejut melalui Silicon Valley, menunjukkan bahwa penalaran AI yang canggih dapat dicapai dengan kekuatan komputasi yang jauh lebih sedikit daripada yang diperkirakan sebelumnya. Ini menantang asumsi mendasar tentang biaya pengembangan AI dan persyaratan infrastruktur. Ketika Deepseek menerbitkan hasilnya, saham Nvidia turun 17% dalam satu hari, investor tiba -tiba mempertanyakan apakah chip mahal benar -benar penting untuk AI tingkat lanjut.
Untuk bisnis, taruhannya tidak bisa lebih tinggi. Perusahaan menghabiskan jutaan orang mengintegrasikan AI ke dalam operasi mereka, bertaruh pada pendekatan mana yang akan mendominasi. Model hybrid Anthropic menawarkan jalur tengah yang menarik: kemampuan untuk menyempurnakan kinerja AI berdasarkan tugas yang ada, dari respons layanan pelanggan instan hingga analisis keuangan yang kompleks. Sistem ini mempertahankan harga antropik sebelumnya sebesar $ 3 per juta token input dan token output $ 15 per juta, bahkan dengan fitur penalaran tambahan.

“Pelanggan kami berusaha mencapai hasil bagi pelanggan mereka,” jelas Michael Gerstenhaber, kepala platform Anthropic. “Menggunakan model yang sama dan mendorong model yang sama dengan cara yang berbeda memungkinkan seseorang seperti Thompson Reuters untuk melakukan penelitian hukum, memungkinkan mitra pengkodean kami seperti Cursor atau GitHub untuk dapat mengembangkan aplikasi dan memenuhi tujuan tersebut.”
Pendekatan hibrida Anthropic mewakili baik evolusi teknis dan gambit strategis. Sementara OpenAI memelihara model yang terpisah untuk kemampuan yang berbeda dan Deepseek berfokus pada efisiensi biaya, Antropik mengejar sistem terpadu yang dapat menangani tugas rutin dan penalaran yang kompleks. Ini adalah filosofi yang dapat membentuk kembali bagaimana bisnis menggunakan AI dan menghilangkan kebutuhan untuk menyulap banyak model khusus.
Temui Kode Claude: Asisten Pengembang Baru AI
Anthropic Today juga meluncurkan kode Claude, alat baris perintah yang memungkinkan pengembang untuk mendelegasikan tugas rekayasa kompleks langsung ke AI. Sistem ini membutuhkan persetujuan manusia sebelum melakukan perubahan kode, mencerminkan pertumbuhan industri yang berkembang pada pengembangan AI yang bertanggung jawab.

“Anda sebenarnya masih harus menerima perubahan yang dilakukan Claude. Anda adalah pengulas dengan tangan [the] Roda, ”kata Penn. “Pada dasarnya ada semacam daftar periksa yang pada dasarnya harus Anda terima untuk model untuk mengambil tindakan tertentu.”
Pengumuman datang di tengah persaingan yang intens dalam pengembangan AI. Peneliti Stanford baru-baru ini membuat model penalaran open-source dengan harga di bawah $ 50, sementara Microsoft hanya mengintegrasikan model O3-mini Openai ke dalam Azure. Keberhasilan Deepseek juga memacu pendekatan baru untuk pengembangan AI, dengan beberapa perusahaan mengeksplorasi teknik distilasi model yang selanjutnya dapat mengurangi biaya.

Dari Pokémon ke Enterprise: Menguji Kecerdasan Baru AI
Penn mengilustrasikan kemajuan dramatis dalam kemampuan AI dengan contoh yang tidak terduga: “Kami telah meminta berbagai versi Claude untuk bermain Pokémon … versi ini telah mencapai semua jalan ke Vermilion City, menangkap banyak Pokémon, dan bahkan menggiling ke level-up . Ia memiliki Pokémon yang tepat untuk bertarung melawan saingan. ”
“Saya pikir Anda akan melihat kami terus berinovasi dan mendorong kualitas penalaran, mendorong hal -hal seperti penalaran dinamis,” jelas Penn. “Kami selalu menganggapnya sebagai bagian inti dari kecerdasan, bukan sesuatu yang terpisah.”
Tes nyata dari pendekatan antropik akan datang dari adopsi perusahaan. Meskipun bermain Pokémon mungkin tampak sepele, itu menunjukkan jenis kebutuhan bisnis intelijen adaptif: AI yang dapat menangani operasi rutin dan keputusan strategis yang kompleks tanpa beralih antara model khusus. Versi sebelumnya dari Claude tidak dapat menavigasi di luar kota awal permainan. Versi terbaru membangun strategi, mengelola sumber daya dan membuat keputusan taktis-kemampuan yang mencerminkan kompleksitas tantangan bisnis dunia nyata.
Untuk pelanggan perusahaan, ini bisa berarti perbedaan antara mempertahankan beberapa sistem AI untuk tugas yang berbeda dan menggunakan solusi tunggal yang lebih mampu. Beberapa bulan ke depan akan mengungkapkan apakah taruhan Anthropic pada penalaran AI terpadu akan membentuk kembali pasar perusahaan atau menjadi hanya eksperimen lain dalam evolusi cepat industri.