
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Penulis, perusahaan AI generatif perusahaan senilai $ 1,9 miliar, hari ini merilis Palmyra X5, model bahasa besar baru (LLM) yang menampilkan jendela konteks 1 juta yang luas yang menjanjikan untuk mempercepat adopsi agen AI otonom di lingkungan perusahaan.
Perusahaan yang berbasis di San Francisco, yang menghitung Accenture, Marriott, Uber, dan Vanguard di antara ratusan pelanggan perusahaannya, telah memposisikan model tersebut sebagai alternatif yang hemat biaya untuk penawaran dari raksasa industri seperti OpenAi dan Antropik, dengan harga yang ditetapkan pada $ 0,60 per juta input token dan $ 6 per juta output ke kokens.
“Model ini benar-benar membuka kunci dunia agen,” kata Matan-Paul Shetrit, direktur produk di Writer, dalam sebuah wawancara dengan VentureBeat. “Ini lebih cepat dan lebih murah daripada model jendela konteks besar yang setara di luar sana seperti GPT-4.1, dan ketika Anda menggabungkannya dengan jendela konteks yang besar dan kemampuan model untuk melakukan panggilan alat atau fungsi, itu memungkinkan Anda untuk mulai benar-benar melakukan hal-hal seperti aliran agen multi-langkah.”
AI Economics Breakthrough: Bagaimana Penulis Melatih Model Powerhouse hanya dengan $ 1 juta
Tidak seperti banyak pesaing, penulis melatih Palmyra X5 dengan data sintetis sekitar $ 1 juta dalam biaya GPU – sebagian kecil dari apa yang dibutuhkan oleh model terkemuka lainnya. Efisiensi biaya ini merupakan keberangkatan yang signifikan dari pendekatan industri yang berlaku untuk pengeluaran puluhan atau ratusan juta untuk pengembangan model.
“Keyakinan kami adalah bahwa token pada umumnya menjadi lebih murah dan lebih murah, dan komputasi menjadi lebih murah dan lebih murah,” jelas Shetrit. “Kami di sini untuk memecahkan masalah nyata, daripada nikel dan meredup pelanggan kami dengan harga.”
Keuntungan biaya perusahaan berasal dari teknik kepemilikan yang dikembangkan selama beberapa tahun. Pada tahun 2023, penulis menerbitkan penelitian tentang “Menjadi Instruksikan Diri,” yang memperkenalkan kriteria penghentian awal untuk penyetelan instruksi minimal. Menurut Shetrit, ini memungkinkan penulis untuk “memotong biaya secara signifikan” selama proses pelatihan.
“Tidak seperti toko -toko dasar lainnya, pandangan kita adalah bahwa kita harus efektif. Kita harus efisien di sini,” kata Shetrit. “Kami perlu memberikan model tercepat dan termurah kepada pelanggan kami, karena ROI benar -benar penting dalam kasus ini.”
Marvel Juta-Token: Arsitektur Teknis yang Menggerakkan Kecepatan dan Akurasi Palmyra X5
Palmyra X5 dapat memproses prompt jutaan-jutaan penuh dalam sekitar 22 detik dan melaksanakan panggilan fungsi multi-turn dalam waktu sekitar 300 milidetik-metrik kinerja yang diklaim penulis memungkinkan “perilaku agen yang sebelumnya biaya atau penghitung waktu.”
Arsitektur model menggabungkan dua inovasi teknis utama: mekanisme perhatian hibrida dan campuran pendekatan ahli. “Mekanisme perhatian hibrida … memperkenalkan mekanisme perhatian yang di dalam model memungkinkannya untuk fokus pada bagian -bagian yang relevan dari input saat menghasilkan setiap output,” kata Shetrit. Pendekatan ini mempercepat generasi respons sambil mempertahankan akurasi di seluruh jendela konteks yang luas.

Pada tes benchmark, Palmyra X5 mencapai hasil penting relatif terhadap biayanya. Tes MRCR 8-Needle Openai-yang menantang model untuk menemukan delapan permintaan identik yang tersembunyi dalam percakapan besar-besaran-Palmyra X5 mencetak 19,1%, dibandingkan dengan 20,25% untuk GPT-4.1 dan 17,63% untuk GPT-4O. Ini juga menempatkan kedelapan dalam pengkodean pada tolok ukur BigCodeBench dengan skor 48,7.
Tolok ukur ini menunjukkan bahwa sementara Palmyra X5 mungkin tidak memimpin setiap kategori kinerja, ini memberikan kemampuan yang hampir bendera dengan biaya yang jauh lebih rendah-pertukaran yang diyakini penulis akan beresonansi dengan pelanggan perusahaan yang berfokus pada ROI.
Dari chatbots ke otomatisasi bisnis: bagaimana agen AI mengubah alur kerja perusahaan
Rilis Palmyra X5 datang tak lama setelah penulis meluncurkan AI HQ awal bulan ini – platform terpusat bagi perusahaan untuk membangun, menggunakan, dan mengawasi agen AI. Strategi produk ganda ini memposisikan penulis untuk memanfaatkan permintaan perusahaan yang berkembang untuk AI yang dapat melaksanakan proses bisnis yang kompleks secara mandiri.
“Di zaman agen, model yang menawarkan kurang dari 1 juta token konteks akan dengan cepat menjadi tidak relevan untuk kasus penggunaan bisnis-kritis,” kata penulis CTO dan co-founder Waseem Alshikh dalam sebuah pernyataan.
Shetrit menguraikan hal ini: “Untuk waktu yang lama, ada kesenjangan besar antara janji agen AI dan apa yang sebenarnya bisa mereka berikan. Tetapi pada penulis, kita sekarang melihat implementasi agen dunia nyata dengan pelanggan perusahaan besar. Dan ketika saya mengatakan pelanggan nyata, itu tidak seperti kasus penggunaan agen perjalanan.
Pengadopsi awal menggunakan Palmyra X5 untuk berbagai alur kerja perusahaan, termasuk pelaporan keuangan, respons RFP, dokumentasi dukungan, dan analisis umpan balik pelanggan.
Salah satu kasus penggunaan yang sangat menarik melibatkan alur kerja agen multi-langkah, di mana agen AI dapat menandai konten yang sudah ketinggalan zaman, menghasilkan revisi yang disarankan, membagikannya untuk persetujuan manusia, dan secara otomatis mendorong pembaruan yang disetujui ke sistem manajemen konten.
Pergeseran dari pembuatan teks sederhana ke otomatisasi proses ini merupakan evolusi mendasar dalam bagaimana perusahaan menggunakan AI – bergerak dari menambah pekerjaan manusia ke mengotomatisasi seluruh fungsi bisnis.

Strategi Ekspansi Cloud: Kemitraan AWS Membawa AI Penulis ke Jutaan Pengembang Perusahaan
Bersamaan dengan rilis model, Writer mengumumkan bahwa Palmyra X5 dan pendahulunya, Palmyra X4, sekarang tersedia di Amazon Bedrock, Amazon Web Services 'Layanan yang dikelola sepenuhnya untuk mengakses model yayasan. AWS menjadi penyedia cloud pertama yang memberikan model yang dikelola penuh dari penulis, secara signifikan memperluas jangkauan potensial perusahaan.
“Akses yang mulus ke Palmyra X5 penulis akan memungkinkan pengembang dan perusahaan untuk membangun dan mengukur agen AI dan mengubah bagaimana mereka beralasan atas sejumlah besar data perusahaan – meningkatkan keamanan, skalabilitas, dan kinerja AWS,” kata Atul Deo, direktur Amazon Bedrock di AWS, dalam pengumuman.
Integrasi AWS membahas hambatan kritis untuk adopsi AI perusahaan: kompleksitas teknis menggunakan dan mengelola model pada skala. Dengan membuat Palmyra X5 tersedia melalui API yang disederhanakan di Bedrock, penulis berpotensi menjangkau jutaan pengembang yang tidak memiliki keahlian khusus untuk bekerja dengan model yayasan secara langsung.
AI belajar mandiri: visi penulis untuk model yang meningkat tanpa intervensi manusia
Penulis telah mempertaruhkan klaim berani mengenai jendela konteks, mengumumkan bahwa 1 juta token akan menjadi ukuran minimum untuk semua model masa depan yang dirilisnya. Komitmen ini mencerminkan pandangan perusahaan bahwa konteks besar sangat penting untuk agen AI tingkat perusahaan yang berinteraksi dengan berbagai sistem dan sumber data.
Ke depan, Shetrit mengidentifikasi model-model yang berkembang sendiri sebagai kemajuan besar berikutnya di perusahaan AI. “Kenyataannya adalah hari ini, agen tidak tampil di level yang kami inginkan dan membutuhkan mereka untuk melakukan,” katanya. “Apa yang saya pikir realistis adalah ketika pengguna datang ke AI HQ, mereka mulai melakukan pemetaan proses ini … dan kemudian Anda melapisi di atas itu, atau di dalamnya, model yang berkembang sendiri yang belajar dari cara Anda melakukan sesuatu di perusahaan Anda.”
Kemampuan yang berkembang sendiri ini akan secara fundamental mengubah bagaimana sistem AI meningkat dari waktu ke waktu. Daripada membutuhkan pelatihan ulang atau penyempurnaan berkala oleh spesialis AI, model akan belajar terus menerus dari interaksi mereka, secara bertahap meningkatkan kinerja mereka untuk kasus penggunaan perusahaan tertentu.
“Gagasan bahwa satu agen dapat memerintah mereka semua tidak realistis,” Shetrit mencatat ketika membahas berbagai kebutuhan tim bisnis yang berbeda. “Bahkan dua tim produk yang berbeda, mereka memiliki begitu banyak cara berbeda dalam melakukan pekerjaan, PMS sendiri.”
Matematika Baru Perusahaan AI: Bagaimana Strategi Penulis $ 1,9 miliar Menantang Openai dan Antropik
Pendekatan penulis sangat kontras dengan openai dan antropik, yang telah mengumpulkan miliaran dalam pendanaan tetapi lebih fokus pada pengembangan AI tujuan umum. Sebaliknya, penulis berkonsentrasi pada membangun model khusus perusahaan dengan profil biaya yang memungkinkan penyebaran luas.
Strategi ini telah menarik minat investor yang signifikan, dengan perusahaan mengumpulkan $ 200 juta dalam pendanaan Seri C November lalu dengan penilaian $ 1,9 miliar. Babak ini dipimpin bersama oleh Premji Invest, Radical Ventures, dan pertumbuhan ICONIQ, dengan partisipasi dari investor strategis termasuk Salesforce Ventures, Adobe Ventures, dan IBM Ventures.
Menurut Forbes, penulis memiliki tingkat retensi bersih 160% yang luar biasa, menunjukkan bahwa pelanggan biasanya memperluas kontrak mereka sebesar 60% setelah adopsi awal. Perusahaan dilaporkan memiliki lebih dari $ 50 juta dalam kontrak dan proyek yang ditandatangani ini akan dua kali lipat menjadi $ 100 juta tahun ini.
Untuk perusahaan yang mengevaluasi investasi AI generatif, penulis Palmyra X5 menyajikan proposisi nilai yang menarik: kemampuan yang kuat pada sebagian kecil dari biaya solusi yang bersaing. Ketika ekosistem agen AI matang, taruhan perusahaan pada model yang hemat biaya, yang berfokus pada perusahaan dapat memposisikannya secara menguntungkan terhadap pesaing yang didanai lebih baik yang mungkin tidak selaras dengan persyaratan ROI bisnis.
“Tujuan kami adalah mendorong adopsi agen yang meluas di seluruh basis pelanggan kami secepat mungkin,” Shetrit menekankan. “Ekonomi langsung-jika kami memberi harga solusi kami terlalu tinggi, perusahaan hanya akan membandingkan biaya agen AI versus pekerja manusia dan mungkin tidak melihat nilai yang cukup. Untuk mempercepat adopsi, kita perlu memberikan kecepatan yang unggul dan biaya yang lebih rendah secara signifikan.
Dalam sebuah industri yang sering terpikat oleh kemampuan teknis dan langit -langit kinerja teoretis, fokus pragmatis penulis pada efisiensi biaya pada akhirnya terbukti lebih revolusioner daripada titik desimal lain dari peningkatan tolok ukur. Ketika perusahaan tumbuh semakin canggih dalam mengukur dampak bisnis AI, pertanyaan dapat bergeser dari “seberapa kuat model Anda?” untuk “Seberapa terjangkau kecerdasan Anda?” – dan penulis bertaruh masa depan bahwa ekonomi, bukan hanya kemampuan, akan menentukan pemenang perusahaan AI.