
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Openai telah merilis model AI milik baru pada waktunya untuk melawan kenaikan cepat saingan open source Deepseek R1 – tetapi apakah akan cukup untuk menumpulkan keberhasilan yang terakhir?
Saat ini, setelah beberapa hari rumor dan meningkatkan antisipasi di antara pengguna AI di media sosial, Openal memulai debutnya O3-Mini, model kedua dalam keluarga baru “Nealaters,” model yang membutuhkan sedikit lebih banyak waktu untuk “berpikir,” menganalisis mereka Proses sendiri dan renungkan “rantai pemikiran” mereka sendiri sebelum menanggapi permintaan pengguna dan input dengan output baru.
Hasilnya adalah model yang dapat dilakukan pada tingkat mahasiswa PhD atau bahkan pemegang gelar untuk menjawab pertanyaan sulit dalam matematika, sains, teknik dan banyak bidang lainnya.
Model O3-Mini sekarang tersedia di ChatGPT, termasuk tingkat gratis, dan Antarmuka Pemrograman Aplikasi Openai (API), dan sebenarnya lebih murah, lebih cepat, dan lebih banyak performan daripada model high-end sebelumnya, O1 Openai dan lebih cepat, lebih cepat, Saudara Hitung Parameter Bawah, O1-Mini.
Meskipun pasti akan dibandingkan dengan Deepseek R1, dan tanggal rilis yang dilihat sebagai reaksi, penting untuk diingat bahwa O3 dan O3-Mini diumumkan dengan baik sebelum rilis Deepseek R1 Januari, pada bulan Desember 2024-dan bahwa CEO Openai Sam bahwa bahwa CEO OpenAI bahwa CEO Openai Sam bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai bahwa Sam Openai itu bahwa Openai bahwa Openai bahwa Openai bahwa Openai bahwa Openai bahwa Openai bahwa Altman menyatakan sebelumnya pada X bahwa karena umpan balik dari pengembang dan peneliti, itu akan datang ke ChatGPT dan OpenAI API pada saat yang sama.
Tidak seperti Deepseek R1, O3-Mini tidak akan tersedia sebagai model open source-yang berarti kode tersebut tidak dapat diambil dan diunduh untuk penggunaan offline, atau disesuaikan dengan tingkat yang sama, yang dapat membatasi daya tariknya dibandingkan dengan Deepseek R1 untuk beberapa aplikasi.
Openai tidak memberikan rincian lebih lanjut tentang model O3 yang lebih besar yang diumumkan pada bulan Desember bersama O3-Mini. Pada saat itu, formulir dropdown opt-in OpenAI untuk pengujian O3 menyatakan bahwa itu akan mengalami “penundaan beberapa minggu” sebelum pihak ketiga dapat mengujinya.
Kinerja dan fitur
Mirip dengan O1, Openai O3-Mini dioptimalkan untuk penalaran dalam matematika, pengkodean, dan sains.
Kinerjanya sebanding dengan Openai O1 saat menggunakan upaya penalaran menengah, tetapi menawarkan keunggulan berikut:
- 24% waktu respons yang lebih cepat dibandingkan dengan O1-mini (Openai tidak memberikan angka tertentu di sini, tetapi melihat tes analisis buatan kelompok evaluasi pihak ketiga, waktu respons O1-Mini adalah 12,8 detik untuk menerima dan menghasilkan 100 token. Jadi untuk O3-Mini, bump speed 24% akan menurunkan waktu respons ke 10,32 detik.)
- Peningkatan akurasi, dengan penguji eksternal lebih memilih respons O3-Mini 56% dari waktu.
- 39% lebih sedikit kesalahan besar pada pertanyaan dunia nyata yang kompleks.
- Kinerja yang lebih baik dalam tugas pengkodean dan batang, terutama saat menggunakan upaya penalaran yang tinggi.
- Tiga tingkat upaya penalaran (rendah, sedang, dan tinggi), memungkinkan pengguna dan pengembang untuk menyeimbangkan akurasi dan kecepatan.
Ini juga menawarkan tolok ukur yang mengesankan, bahkan melampaui O1 dalam beberapa kasus, menurut kartu sistem O3-Mini OpenAI yang dirilis secara online (dan yang diterbitkan lebih awal dari pengumuman ketersediaan model resmi).
Jendela konteks O3-Mini-jumlah token gabungan yang dapat dimasukkan/output dalam satu interaksi-adalah 200.000, dengan maksimum 100.000 di setiap output. Itu sama dengan model O1 penuh dan mengungguli jendela konteks Deepseek R1 sekitar 128.000/130.000 token. Tapi jauh di bawah jendela konteks baru Google Gemini 2.0 Flash Thinking hingga 1 juta token.
Sementara O3-Mini berfokus pada kemampuan penalaran, ia belum memiliki kemampuan penglihatan. Pengembang dan pengguna yang ingin mengunggah gambar dan file harus terus menggunakan O1 sementara itu.
Kompetisi memanas
Kedatangan O3-Mini menandai pertama kali Openai membuat model penalaran yang tersedia untuk pengguna chatgpt gratis. Keluarga model O1 sebelumnya hanya tersedia untuk membayar pelanggan dari ChatGPT Plus, Pro dan rencana lainnya, serta melalui antarmuka pemrograman aplikasi berbayar OpenAI.
As it did with large language model (LLM)-powered chatbots via the launch of ChatGPT in November 2022, OpenAI essentially created the entire category of reasoning models back in September 2024 when it first unveiled o1, a new class of models with a new training rezim dan arsitektur.
Tetapi Openai, sesuai dengan sejarahnya yang baru -baru ini, tidak membuat O1 open source, bertentangan dengan namanya dan misi pendirian aslinya. Sebaliknya, itu membuat kode model model.
Dan selama dua minggu terakhir, O1 telah dibayangi oleh startup AI China Deepseek, yang meluncurkan R1, saingan, sangat efisien, sebagian besar model penalaran open-source yang tersedia secara bebas untuk mengambil, melatih, dan menyesuaikan oleh siapa pun di seluruh dunia, juga Seperti yang digunakan secara gratis di situs web dan aplikasi seluler Deepseek – sebuah model yang dilaporkan dilatih di sebagian kecil dari biaya O1 dan LLM lainnya dari Top Labs.
Ketentuan lisensi MIT permisif Deepseek R1, aplikasi/situs web gratis untuk konsumen, dan keputusan untuk membuat basis kode R1 tersedia secara bebas untuk diambil dan dimodifikasi telah membawanya ke ledakan penggunaan yang benar -benar di pasar konsumen maupun perusahaan – bahkan investor OpenAI Microsoft dan antropik backer antropik baik Amazon bergegas untuk menambahkan varian ke pasar cloud mereka. Perplexity, perusahaan pencarian AI, juga dengan cepat menambahkan varian untuk pengguna.
Deepseek juga mencopot aplikasi chatgpt iOS untuk tempat nomor satu di Apple App Store AS, dan terkenal karena melampaui openai dengan menghubungkan model R1 ke pencarian web di aplikasinya dan di web, sesuatu yang Openai belum dilakukan untuk O1 , mengarah ke kecemasan techno lebih lanjut di antara pekerja teknologi dan lainnya secara online bahwa China mengejar ketinggalan atau telah melampaui AS dalam inovasi AI – bahkan teknologi secara lebih umum.
Banyak peneliti dan ilmuwan AI dan VC top seperti Marc Andreessen, bagaimanapun, telah menyambut kebangkitan Deepseek dan sumber terbuka khususnya sebagai gelombang yang mengangkat semua kapal di bidang AI, meningkatkan kecerdasan yang tersedia untuk semua orang sambil mengurangi biaya.
Ketersediaan di chatgpt
Model ini sekarang diluncurkan secara global ke pengguna gratis, plus, tim, dan pro, dengan akses perusahaan dan pendidikan datang minggu depan.
- Pengguna gratis dapat mencoba O3-Mini untuk pertama kalinya dengan memilih tombol “Alasan” di bilah obrolan atau meregenerasi respons.
- Batas pesan telah meningkat 3x untuk plus dan pengguna tim, naik dari 50 menjadi 150 pesan per hari.
- Pengguna Pro mendapatkan akses tak terbatas ke O3-Mini dan varian baru yang bahkan lebih tinggi, O3-mini-tinggi.
Selain itu, O3-Mini sekarang mendukung integrasi pencarian di dalam chatgpt, memberikan tanggapan dengan tautan web yang relevan. Fitur ini masih dalam tahap awal karena Openai memurnikan kemampuan pencarian di seluruh model penalarannya.
Integrasi dan harga API
Untuk pengembang, O3-Mini tersedia melalui API Penyelesaian Obrolan, API Asisten, dan API Batch. Model ini mendukung panggilan fungsi, output terstruktur, dan pesan pengembang, membuatnya mudah untuk diintegrasikan ke dalam aplikasi dunia nyata.
Salah satu keunggulan O3-Mini yang paling menonjol adalah efisiensi biayanya: 63% lebih murah daripada Openai O1-Mini dan 93% lebih murah daripada model O1 penuh, dengan harga $ 1,10/$ 4,40 per juta token masuk/keluar (dengan diskon cache 50% 50% (50% ).
Namun masih ada jika dibandingkan dengan keterjangkauan penawaran R1 Deepseek API resmi sebesar $ 0,14/$ 0,55 per juta token masuk/keluar. Tetapi mengingat Deepseek berbasis di Cina dan dilengkapi dengan kesadaran geopolitik yang menyertainya dan masalah keamanan tentang data pengguna/perusahaan yang mengalir masuk dan keluar dari model, kemungkinan OpenAI akan tetap menjadi API yang disukai untuk beberapa pelanggan dan perusahaan yang berfokus pada keamanan di AS di AS. dan Eropa.
Pengembang juga dapat menyesuaikan tingkat upaya penalaran (rendah, sedang, tinggi) berdasarkan kebutuhan aplikasi mereka, memungkinkan untuk lebih banyak kontrol atas latensi dan akurasi trade-off.
Secara aman, Openai mengatakan menggunakan sesuatu yang disebut “perataan deliberatif” dengan O3-Mini. Ini berarti model diminta untuk beralasan tentang pedoman keselamatan yang ditulis manusia yang diberikan, lebih memahami niat mereka dan kerugian yang dirancang untuk dicegah, dan menghasilkan caranya sendiri untuk memastikan kerusakan itu dicegah. Openai mengatakan itu memungkinkan model menjadi kurang disensor ketika membahas topik sensitif sambil juga menjaga keamanan.
Openai mengatakan model mengungguli GPT-4O dalam menangani tantangan keselamatan dan jailbreak, dan bahwa ia melakukan pengujian keselamatan eksternal yang luas sebelum dirilis hari ini.
Laporan baru -baru ini dicakup Kabel ;
Apa Berikutnya?
Peluncuran O3-Mini mewakili upaya Openai yang lebih luas untuk membuat penalaran canggih AI lebih mudah diakses dan hemat biaya dalam menghadapi persaingan yang lebih intens daripada sebelumnya dari Deepseek's R1 dan lainnya, seperti Google, yang baru-baru ini merilis versi gratisnya sendiri Model penalaran saingan Gemini 2 flash thinking dengan konteks input yang diperluas hingga 1 juta token.
Dengan fokusnya pada penalaran dan keterjangkauan STEM, Openai bertujuan untuk memperluas jangkauan pemecahan masalah yang digerakkan oleh AI pada aplikasi konsumen dan pengembang.
Tetapi karena perusahaan menjadi lebih ambisius dari sebelumnya dalam tujuannya – baru -baru ini mengumumkan proyek infrastruktur pusat data senilai $ 500 miliar yang disebut Stargate dengan dukungan dari SoftBank – pertanyaannya tetap atau tidak, strateginya akan membayar dengan cukup baik untuk membenarkan multibilon yang tenggelam ke dalamnya olehnya atau tidak Investor yang berantakan dalam seperti Microsoft dan VC lainnya.
Karena model open source semakin mendekati kesenjangan dengan openai dalam kinerja dan mengalahkannya dalam biaya, akan dilaporkan bahwa langkah-langkah keselamatannya yang lebih unggul, kemampuan yang kuat, API yang mudah digunakan dan antarmuka yang ramah pengguna cukup untuk memelihara pelanggan-terutama di perusahaan- Siapa yang dapat memprioritaskan biaya dan efisiensi dibandingkan atribut ini? Kami akan melaporkan perkembangan saat mereka terungkap.