
Bergabunglah dengan acara yang dipercaya oleh para pemimpin perusahaan selama hampir dua dekade. VB Transform menyatukan orang -orang yang membangun strategi AI perusahaan nyata. Pelajari lebih lanjut
Kabar baik, pengembang AI!
Openai telah mengumumkan pemotongan harga yang substansial pada O3, penalaran andalannya Model Bahasa Besar (LMM), memangkas biaya dengan 80% kekalahan untuk token input dan output.
; untuk hak istimewa dengan biaya per juta token).
Pembaruan memposisikan model sebagai opsi yang lebih mudah diakses bagi pengembang yang mencari kemampuan penalaran lanjutan, dan menempatkan OpenAi dalam persaingan harga yang lebih langsung dengan model saingan seperti Gemini 2.5 Pro dari Google DeepMind, Claude Opus 4 dari Anthropic, dan Reasoning Suite Deepseek.
Diumumkan oleh Altman sendiri di x
Sam Altman, CEO Openai, mengkonfirmasi perubahan dalam sebuah posting di X yang menyoroti bahwa harga baru dimaksudkan untuk mendorong eksperimen yang lebih luas, menulis: “Kami menurunkan harga O3 sebesar 80%!! bersemangat untuk melihat apa yang akan dilakukan orang dengan itu sekarang. Pikirkan Anda juga akan senang dengan harga O3-Pro untuk kinerja :)”
Biaya menggunakan O3 sekarang $ 2 per juta token input dan token output $ 8 per juta, dengan diskon tambahan $ 0,50 per juta token ketika pengguna memasukkan informasi yang telah “di -cache,” atau disimpan dan identik dengan apa yang mereka berikan sebelumnya.
Ini menandai pengurangan yang signifikan dari tarif sebelumnya $ 10 (input) dan $ 40 (output), seperti yang ditunjukkan oleh peneliti Openai Noam Brown pada X.
Ray Fernando, seorang pengembang dan pengadopsi awal, merayakan penurunan harga dalam posting menulis “LFG!” Singkat untuk “Ayo pergi!”
Sentimen mencerminkan antusiasme yang berkembang di antara pembangun yang ingin mengukur proyek mereka tanpa biaya akses model yang mahal.
Perbandingan harga dengan penalaran saingan lainnya LLMS
Penyesuaian harga datang pada saat penyedia AI bersaing lebih agresif pada kinerja dan keterjangkauan. Perbandingan dengan model penalaran AI terkemuka lainnya menggambarkan betapa signifikannya langkah ini:
- Pratinjau Gemini 2.5 Prodikembangkan oleh Google DeepMind, biaya antara $ 1,25 dan $ 2,50 untuk input tergantung pada ukuran cepat, dan $ 10 hingga $ 15 untuk output. Sementara integrasinya dengan Google Search menawarkan fungsionalitas tambahan, layanan itu memiliki biaya sendiri – gratis untuk 1.500 permintaan pertama per hari, kemudian $ 35 per ribu permintaan.
- Claude Opus 4dipasarkan dengan antropik sebagai model yang dioptimalkan untuk tugas -tugas kompleks, adalah yang paling mahal dari grup, mengenakan token input $ 15 per juta dan $ 75 untuk output. Layanan Baca dan Tulis Caching Prompt masing -masing datang pada $ 1,50 dan $ 18,75, meskipun pengguna dapat membuka diskon 50% dengan pemrosesan batch.
- Model Deepseek, terutama Deepseek-Reasoner dan Deepseek-Obrol, meremehkan sebagian besar pasar dengan harga rendah yang agresif. Token input berkisar dari $ 0,07 hingga $ 0,55 tergantung pada caching dan waktu hari, sementara output berkisar dari $ 1,10 hingga $ 2,19. Diskon tarif selama jam tidak parah menurunkan harga lebih jauh, hingga serendah $ 0,035 untuk input yang di-cache.
Model | Masukan | Input yang di -cache | Keluaran | Catatan Diskon |
---|---|---|---|---|
Openai O3 | $ 2,00 (turun dari $ 10,00) | $ 0,50 | $ 8,00 (turun dari $ 40,00) | Pemrosesan Flex: $ 5 / $ 20 |
Gemini 2.5 Pro | $ 1,25 – $ 2,50 | $ 0,31 – $ 0,625 | $ 10.00 – $ 15.00 | Tingkat yang lebih tinggi berlaku untuk meminta> Token 200K |
Claude Opus 4 | $ 15.00 | $ 1,50 (baca) / $ 18,75 (tulis) | $ 75,00 | Diskon 50% dengan pemrosesan batch |
Deepseek-Cat | $ 0,07 (hit) $ 0,27 (Miss) | – – | $ 1,10 | Diskon 50% selama jam kerja di luar puncak |
Deepseek-Reasoner | $ 0,14 (hit) $ 0,55 (Miss) | – – | $ 2,19 | Diskon 75% selama jam kerja di luar puncak |
Selain itu, perbandingan model AI pihak ketiga yang independen dan analisis buatan kelompok penelitian menjalankan O3 baru melalui rangkaian tes pembandingannya pada berbagai tugas, dan ternyata harganya $ 390 untuk menyelesaikan semuanya, dibandingkan $ 971 untuk Gemini 2.5 Pro dan $ 342 untuk Claude 4 Sonnet.
Mempersempit kesenjangan biaya vs intelijen untuk pengembang
Langkah harga Openai tidak hanya mempersempit kesenjangan dengan model berbiaya-ultra-murah seperti Deepseek tetapi juga memberi tekanan ke bawah pada penawaran dengan harga lebih tinggi seperti Claude Opus dan Gemini Pro.
Tidak seperti Claude atau Gemini, Openai's O3 juga sekarang menawarkan mode fleksibel untuk pemrosesan sinkron yang mengenakan biaya $ 5 untuk input dan $ 20 untuk output per juta token, memberi pengembang lebih banyak kontrol atas biaya komputasi dan latensi tergantung pada jenis beban kerja.
O3 saat ini tersedia melalui Openai API dan Playground. Pengguna dengan saldo serendah beberapa dolar sekarang dapat mengeksplorasi kemampuan penuh model, memungkinkan prototipe dan penyebaran dengan hambatan keuangan yang lebih sedikit.
Ini secara khusus dapat menguntungkan startup, tim peneliti, dan pengembang individu yang sebelumnya menemukan biaya yang mahal dengan biaya akses biaya.
Dengan secara substansial menurunkan biaya model penalaran yang paling canggih, OpenAI menandakan tren yang lebih luas dalam ruang AI generatif: kinerja premium dengan cepat menjadi lebih terjangkau, dan pengembang sekarang memiliki semakin banyak pilihan yang layak secara ekonomi.