
Openai meluncurkan keluarga baru model AI pagi ini yang secara signifikan meningkatkan kemampuan pengkodean sambil memotong biaya, merespons langsung terhadap meningkatnya persaingan di pasar AI perusahaan.
Perusahaan AI yang berbasis di San Francisco memperkenalkan tiga model-GPT-4.1, GPT-4.1 Mini, dan GPT-4.1 Nano-semuanya tersedia segera melalui API-nya. Lineup baru berkinerja lebih baik pada tugas rekayasa perangkat lunak, mengikuti instruksi lebih tepat, dan dapat memproses hingga satu juta token konteks, setara dengan sekitar 750.000 kata.
“GPT-4.1 menawarkan kinerja luar biasa dengan biaya lebih rendah,” kata Kevin Weil, kepala produk produk di Openai, selama pengumuman hari Senin. “Model-model ini lebih baik daripada GPT-4O pada hampir setiap dimensi.”
Mungkin yang paling signifikan bagi pelanggan perusahaan adalah harga: GPT-4.1 akan menelan biaya 26% lebih rendah dari pendahulunya, sementara versi nano ringan menjadi penawaran Openai yang paling terjangkau hanya dengan 12 sen per juta token.
Bagaimana perbaikan gpt-4.1 menargetkan poin rasa sakit terbesar pengembang perusahaan
Dalam wawancara yang jujur dengan VentureBeat, Michelle Pokrass, pemeran utama penelitian pasca pelatihan di Openai, menekankan bahwa aplikasi bisnis praktis mendorong proses pengembangan.
“GPT-4.1 dilatih dengan satu tujuan: menjadi berguna bagi pengembang,” kata Pokrass kepada VentureBeat. “Kami telah menemukan GPT-4.1 jauh lebih baik dalam mengikuti jenis instruksi yang digunakan perusahaan dalam praktik, yang membuatnya lebih mudah untuk menggunakan aplikasi yang siap-produksi.”
Fokus pada utilitas dunia nyata ini tercermin dalam hasil benchmark. Pada SWE-Bench diverifikasi, yang mengukur kemampuan rekayasa perangkat lunak, GPT-4.1 mencetak 54,6%-peningkatan poin persentase 21,4 substansial dibandingkan GPT-4O.
Untuk bisnis yang mengembangkan agen AI yang bekerja secara mandiri pada tugas -tugas yang kompleks, peningkatan pengikut instruksi sangat berharga. Pada patokan multichallenge skala, GPT-4.1 mencetak 38,3%, mengungguli GPT-4O dengan 10,5 poin persentase.
Mengapa Strategi Model Tiga Tingkat Openai menantang pesaing seperti Google dan Antropik
Pengenalan tiga model berbeda pada titik harga yang berbeda membahas pasar AI yang beragam. GPT-4.1 andalan menargetkan aplikasi perusahaan yang kompleks, sementara versi mini dan nano membahas kasus penggunaan di mana kecepatan dan efisiensi biaya adalah prioritas.
“Tidak semua tugas membutuhkan kemampuan paling intelijen atau top,” kata Pokrass kepada VentureBeat. “Nano akan menjadi model pekerja keras untuk menggunakan kasus seperti Autocomplete, Klasifikasi, Ekstraksi Data, atau apa pun di mana kecepatan menjadi perhatian utama.”
Secara bersamaan, Openai mengumumkan rencana untuk mencela pratinjau GPT-4.5-model terbesarnya dan termahal yang dirilis hanya dua bulan yang lalu-dari API-nya pada 14 Juli. Perusahaan memposisikan GPT-4.1 sebagai pengganti yang lebih hemat biaya yang memberikan “peningkatan atau kinerja serupa pada banyak kemampuan utama dengan biaya dan latensi yang jauh lebih rendah.”
Langkah ini memungkinkan OpenAi untuk merebut kembali sumber daya komputasi sambil memberikan pengembang alternatif yang lebih efisien untuk penawaran paling mahal, yang telah dihargai $ 75 per juta token input dan token output $ 150 per juta.
Hasil dunia nyata: Bagaimana Thomson Reuters, Carlyle dan Windsurf memanfaatkan GPT-4.1
Beberapa pelanggan perusahaan yang menguji model sebelum peluncuran melaporkan peningkatan substansial dalam domain spesifik mereka.
Thomson Reuters melihat peningkatan 17% dalam akurasi tinjauan multi-dokumen saat menggunakan GPT-4.1 dengan asisten AI legal, Cocounsel. Peningkatan ini sangat berharga untuk alur kerja hukum yang kompleks yang melibatkan dokumen panjang dengan hubungan yang bernuansa antara klausa.
Perusahaan keuangan Carlyle melaporkan kinerja 50% lebih baik dalam mengekstraksi data keuangan granular dari dokumen padat-kemampuan penting untuk analisis investasi dan pengambilan keputusan.
Varun Mohan, CEO Penyedia Alat Pengkodean Windsurf (sebelumnya Codeium), berbagi metrik kinerja terperinci selama pengumuman.
“Kami menemukan bahwa GPT-4.1 mengurangi berapa kali ia perlu membaca file yang tidak perlu sebesar 40% dibandingkan dengan model terkemuka lainnya, dan juga memodifikasi file yang tidak perlu 70% lebih sedikit,” kata Mohan. “Model ini juga secara mengejutkan lebih sedikit verbose … GPT-4.1 adalah 50% lebih sedikit verbose daripada model terkemuka lainnya.”
Konteks Juta-Token: Apa yang Dapat Dilakukan Bisnis Dengan Kapasitas Pemrosesan 8x Lebih
Ketiga model ini memiliki jendela konteks satu juta token-delapan kali lebih besar dari batas 128.000 token GPT-4O. Kapasitas yang diperluas ini memungkinkan model untuk memproses beberapa dokumen panjang atau seluruh basis kode sekaligus.
Dalam sebuah demonstrasi, OpenAI menunjukkan GPT-4.1 menganalisis file log server NASA 450.000 dari 1995, mengidentifikasi entri anomali yang bersembunyi jauh di dalam data. Kemampuan ini sangat berharga untuk tugas yang melibatkan kumpulan data besar, seperti repositori kode atau koleksi dokumen perusahaan.
Namun, OpenAI mengakui degradasi kinerja dengan input yang sangat besar. Pada uji internal openai-MRCR, akurasi turun dari sekitar 84% dengan 8.000 token hingga 50% dengan satu juta token.
Bagaimana lanskap AI perusahaan bergeser saat Google, Antropik dan OpenAI bersaing untuk pengembang
Rilis ini hadir sebagai kompetisi di ruang AI perusahaan memanas. Google baru-baru ini meluncurkan Gemini 2.5 Pro dengan jendela konteks satu juta yang sebanding, sementara Claude 3.7 Sonnet Anthropic telah mendapatkan daya tarik dengan bisnis yang mencari alternatif untuk penawaran Openai.
Startup AI China Deepseek juga baru -baru ini meningkatkan modelnya, memberikan tekanan tambahan pada OpenAI untuk mempertahankan posisi kepemimpinannya.
“Sangat keren melihat bagaimana peningkatan dalam pemahaman konteks panjang telah diterjemahkan ke dalam kinerja yang lebih baik pada vertikal spesifik seperti analisis hukum dan mengekstraksi data keuangan,” kata Pokrass. “Kami telah menemukan sangat penting untuk menguji model kami di luar tolok ukur akademik dan memastikan mereka berkinerja baik dengan perusahaan dan pengembang.”
Dengan merilis model -model ini secara khusus melalui API -nya daripada chatgpt, Openai menandakan komitmennya kepada pengembang dan pelanggan perusahaan. Perusahaan berencana untuk secara bertahap memasukkan fitur dari GPT-4.1 ke dalam chatgpt dari waktu ke waktu, tetapi fokus utama tetap pada penyediaan alat yang kuat untuk bisnis membangun aplikasi khusus.
Untuk mendorong penelitian lebih lanjut dalam pemrosesan konteks panjang, OpenAI merilis dua dataset evaluasi: OpenAI-MRCR untuk menguji kemampuan coreference multi-putar dan graphwalk untuk mengevaluasi penalaran kompleks di seluruh dokumen panjang.
Untuk pembuat keputusan perusahaan, keluarga GPT-4.1 menawarkan pendekatan yang lebih praktis dan hemat biaya untuk implementasi AI. Ketika organisasi terus mengintegrasikan AI ke dalam operasi mereka, peningkatan keandalan, spesifisitas, dan efisiensi ini dapat mempercepat adopsi di seluruh industri yang masih menimbang biaya implementasi terhadap potensi manfaat.
Sementara pesaing mengejar model yang lebih besar dan lebih mahal, pivot strategis Openai dengan GPT-4.1 menunjukkan masa depan AI mungkin bukan milik model terbesar, tetapi yang paling efisien. Terobosan nyata mungkin tidak ada dalam tolok ukur, tetapi dalam membawa AI kelas perusahaan dalam jangkauan lebih banyak bisnis daripada sebelumnya.