
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Openai meluncurkan dua model AI inovatif saat ini yang dapat bernalar dengan gambar dan menggunakan alat secara mandiri, mewakili apa yang oleh para ahli menyebut langkah perubahan dalam kemampuan kecerdasan buatan.
Perusahaan yang berbasis di San Francisco memperkenalkan O3 dan O4-Mini, yang terbaru dalam “O-Series” model penalaran, yang diklaimnya adalah model yang paling cerdas dan mampu hingga saat ini. Sistem ini dapat mengintegrasikan gambar secara langsung ke dalam proses penalaran mereka, mencari web, menjalankan kode, menganalisis file, dan bahkan menghasilkan gambar dalam satu aliran tugas.
“Ada beberapa model yang terasa seperti langkah kualitatif ke masa depan. GPT-4 adalah salah satunya. Hari ini juga akan menjadi salah satu dari hari-hari itu,” kata Greg Brockman, presiden Openai, selama konferensi pers yang mengumumkan rilis. “Ini adalah model pertama di mana para ilmuwan top memberi tahu kami bahwa mereka menghasilkan ide -ide baru yang baik dan bermanfaat.”
Bagaimana Model Baru Openai Berpikir dengan Gambar 'untuk Mengubah Pemecahan Masalah Visual
Fitur yang paling mencolok dari model-model baru ini adalah kemampuan mereka untuk “berpikir dengan gambar”-tidak hanya melihatnya, tetapi memanipulasi dan alasan tentang mereka sebagai bagian dari proses pemecahan masalah mereka.
“Mereka tidak hanya melihat gambar – mereka berpikir dengan itu,” kata Openai dalam sebuah pernyataan yang dikirim ke VentureBeat. “Ini membuka kelas pemecahan masalah baru yang memadukan penalaran visual dan tekstual.”
Selama demonstrasi di konferensi pers, seorang peneliti menunjukkan bagaimana O3 dapat menganalisis poster fisika dari magang yang sudah berusia satu dekade, menavigasi diagram kompleksnya secara mandiri, dan bahkan mengidentifikasi bahwa hasil akhirnya tidak ada di poster itu sendiri.
“Itu pasti baru saja membaca, Anda tahu, setidaknya seperti 10 makalah yang berbeda dalam beberapa detik bagi saya,” Brandon McKenzie, seorang peneliti di Openai yang bekerja pada penalaran multimoda, mengatakan selama demo. Dia memperkirakan tugas itu akan membawanya “berhari -hari hanya untuk saya bahkan suka, di atas diri saya sendiri, kembali ke proyek saya, dan kemudian beberapa hari lebih mungkin, untuk benar -benar mencari melalui literatur.”
Kemampuan AI untuk memanipulasi gambar dalam proses penalaran – memperbesar detail, diagram berputar, atau memangkas elemen yang tidak perlu – merupakan pendekatan baru yang menurut analis industri dapat merevolusi bidang dari penelitian ilmiah ke pendidikan.
Saya memiliki akses awal, O3 adalah model yang mengesankan, tampaknya sangat mampu. Beberapa contoh yang menyenangkan:
– Ethan Mollick (@emollick) 16 April 2025
1) memecahkan kasus bisnis yang saya gunakan di kelas saya
2) Membuat beberapa SVG (gambar yang dibuat oleh kode saja)
3) Menulis cerita terbatas tentang dua gyres yang saling terkait
4) Pertempuran ruang fiksi ilmiah yang keras. pic.twitter.com/tk4pkvknot
Eksekutif OpenAI menekankan bahwa rilis ini mewakili lebih dari sekadar model yang ditingkatkan – mereka sistem AI lengkap yang dapat secara mandiri menggunakan dan rantai bersama -sama banyak alat saat menyelesaikan masalah.
“Kami telah melatih mereka untuk menggunakan alat melalui pembelajaran penguatan – mengajar mereka tidak hanya bagaimana menggunakan alat, tetapi untuk alasan kapan menggunakannya,” perusahaan menjelaskan dalam rilisnya.
Greg Brockman menyoroti kemampuan penggunaan alat yang luas model: “Mereka benar -benar menggunakan alat -alat ini dalam rantai pemikiran mereka saat mereka mencoba untuk memecahkan masalah yang sulit. Misalnya, kami telah melihat O3 menggunakan seperti 600 panggilan alat berturut -turut mencoba menyelesaikan tugas yang sangat sulit.”
Kemampuan ini memungkinkan model untuk melakukan alur kerja multi-langkah yang kompleks tanpa arah manusia yang konstan. Misalnya, jika ditanya tentang pola penggunaan energi di masa depan di California, AI dapat mencari di web untuk data utilitas, menulis kode Python untuk menganalisisnya, menghasilkan visualisasi, dan menghasilkan laporan yang komprehensif – semuanya sebagai proses fluida tunggal.
Openai melonjak di depan pesaing dengan kinerja pemecah rekor pada tolok ukur AI utama
Openai mengklaim O3 menetapkan tolok ukur canggih baru di seluruh ukuran utama kemampuan AI, termasuk codeforces, swe-bench, dan MMMU. Dalam evaluasi oleh para ahli eksternal, O3 dilaporkan membuat 20 persen lebih sedikit kesalahan besar daripada pendahulunya pada tugas-tugas yang sulit, dunia nyata.
Model O4-Mini yang lebih kecil dioptimalkan untuk kecepatan dan efisiensi biaya sambil mempertahankan kemampuan penalaran yang kuat. Pada kompetisi matematika AIME 2025, O4-Mini mencetak 99,5 persen ketika diberikan akses ke juru bahasa Python.
“Saya benar-benar percaya bahwa dengan rangkaian model ini, O3 dan O4-Mini, kita akan melihat lebih banyak kemajuan,” Mark Chen, kepala penelitian Openai, mengatakan selama konferensi pers.
Waktu rilis ini signifikan, datang hanya dua hari setelah Openai meluncurkan model GPT-4.1-nya, yang unggul dalam tugas pengkodean. Suksesi pengumuman yang cepat menandakan akselerasi dalam lanskap AI kompetitif, di mana Openai menghadapi peningkatan tekanan dari model Gemini Google, Claude Anthropic, dan Xai Elon Musk.
Bulan lalu, Openai menutup berapa jumlah putaran pendanaan teknologi swasta terbesar dalam sejarah, mengumpulkan $ 40 miliar pada penilaian $ 300 miliar. Perusahaan ini juga dilaporkan mempertimbangkan untuk membangun jejaring sosialnya sendiri, berpotensi untuk bersaing dengan platform X Elon Musk dan untuk mengamankan sumber data pelatihan yang eksklusif.
O3 dan O4-Mini sangat baik dalam pengkodean, jadi kami merilis produk baru, Codex CLI, untuk membuatnya lebih mudah digunakan.
Ini adalah agen pengkodean yang berjalan di komputer Anda. Ini sepenuhnya open source dan tersedia saat ini; Kami berharap akan meningkat dengan cepat.
– Sam Altman (@sama) 16 April 2025
Bagaimana Model Baru Openai Mengubah Rekayasa Perangkat Lunak dengan Kemampuan Navigasi Kode yang belum pernah terjadi sebelumnya
Salah satu area di mana model baru khususnya Excel adalah rekayasa perangkat lunak. Brockman mencatat selama konferensi pers bahwa O3 “sebenarnya lebih baik daripada saya dalam menavigasi melalui basis kode openai kami, yang sangat berguna.”
Sebagai bagian dari pengumuman, Openai juga memperkenalkan Codex CLI, agen pengkodean ringan yang berjalan langsung di terminal pengguna. Alat open-source memungkinkan pengembang untuk memanfaatkan kemampuan penalaran model untuk tugas pengkodean, dengan dukungan untuk tangkapan layar dan sketsa.
“Kami juga berbagi percobaan baru: Codex CLI, agen pengkodean ringan yang dapat Anda jalankan dari terminal Anda,” perusahaan mengumumkan. “Anda bisa mendapatkan manfaat dari penalaran multimodal dari baris perintah dengan melewati tangkapan layar atau sketsa kesetiaan rendah ke model, dikombinasikan dengan akses ke kode Anda secara lokal.”
Untuk mendorong adopsi, OpenAI meluncurkan inisiatif $ 1 juta untuk mendukung proyek menggunakan model CODEX CLI dan OpenAI, dengan hibah yang tersedia dengan tambahan $ 25.000 dalam kredit API.
Di dalam Protokol Keselamatan yang Ditingkatkan Openai: Bagaimana Perusahaan Melindungi dari Penyalahgunaan AI
Laporan OpenAI yang melakukan pengujian keselamatan yang luas pada model -model baru, khususnya berfokus pada kemampuan mereka untuk menolak permintaan yang berbahaya. Langkah-langkah keselamatan perusahaan mencakup sepenuhnya membangun kembali data pelatihan keselamatan mereka dan mengembangkan mitigasi tingkat sistem untuk menandai petunjuk berbahaya.
“Kami menekankan kedua model dengan program keselamatan kami yang paling ketat hingga saat ini,” kata perusahaan, mencatat bahwa baik O3 dan O4-Mini tetap di bawah ambang batas “tinggi” Openai untuk risiko potensial dalam kemampuan biologis, keamanan siber, dan peningkatan diri AI.
Selama konferensi pers, para peneliti Openai Wenda dan Ananya mempresentasikan hasil benchmark terperinci, mencatat bahwa model -model baru menjalani lebih dari 10 kali komputasi pelatihan versi sebelumnya untuk mencapai kemampuan mereka.
Kapan dan bagaimana Anda dapat mengakses O3 dan O4-Mini: Timeline Penyebaran dan Strategi Komersial
Model -model baru segera tersedia untuk pengguna ChatGPT Plus, Pro, dan tim, dengan pelanggan perusahaan dan pendidikan mendapatkan akses minggu depan. Pengguna gratis dapat mencicipi O4-Mini dengan memilih “Think” di komposer sebelum mengirimkan pertanyaan.
Pengembang dapat mengakses kedua model melalui API penyelesaian obrolan OpenAI dan Responses API, meskipun beberapa organisasi akan memerlukan verifikasi untuk mengaksesnya.
Rilis ini merupakan peluang komersial yang signifikan untuk Openai, karena model tampak lebih mampu dan lebih hemat biaya daripada pendahulunya. “Misalnya, pada kompetisi matematika AIME 2025, perbatasan kinerja biaya untuk O3 secara ketat meningkat lebih dari O1, dan juga, perbatasan O4-Mini secara ketat meningkat lebih dari O3-Mini,” kata perusahaan itu.
Masa depan AI: Bagaimana Openai menjembatani penalaran dan percakapan untuk sistem generasi berikutnya
Analis industri memandang rilis ini sebagai bagian dari konvergensi yang lebih luas dalam kemampuan AI, dengan model semakin menggabungkan penalaran khusus dengan kemampuan percakapan alami dan penggunaan alat.
“Pembaruan hari ini mencerminkan arah yang sedang kami tuju: kami sedang menyatu dengan kemampuan penalaran khusus dari seri-O dengan lebih banyak kemampuan percakapan alami dan penggunaan alat-seri GPT,” kata Openai dalam rilisnya.
Ethan Mollick, associate professor di Wharton School yang mempelajari adopsi AI, menggambarkan O3 sebagai “model yang sangat kuat, tetapi masih bergerigi” di sebuah pos media sosial setelah pengumuman.
Ketika persaingan di ruang AI terus mengintensifkan, dengan Google, Antropik, dan lainnya melepaskan model yang semakin kuat, fokus ganda Openai pada kemampuan penalaran dan penggunaan alat praktis menunjukkan strategi yang bertujuan mempertahankan posisi kepemimpinannya dengan memberikan intelijen dan utilitas.
Dengan O3 dan O4-Mini, Openai telah melintasi ambang batas di mana mesin mulai memahami gambar seperti yang dilakukan manusia-memanipulasi informasi visual sebagai bagian integral dari proses pemikiran mereka daripada hanya menganalisis apa yang mereka lihat. Pergeseran dari pengakuan pasif ke penalaran visual yang aktif pada akhirnya terbukti lebih signifikan daripada skor benchmark, mewakili saat ketika AI mulai benar -benar melihat dunia melalui pemikiran mata.