
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Openai sekarang menunjukkan lebih banyak detail tentang proses penalaran O3-Mini, model penalaran terbarunya. Perubahan diumumkan pada akun X Openai dan datang karena laboratorium AI berada di bawah tekanan yang meningkat oleh Deepseek-R1, model saingan terbuka yang sepenuhnya menampilkan token penalarannya.
Model seperti O3 dan R1 menjalani proses “rantai pemikiran” (COT) yang panjang di mana mereka menghasilkan token tambahan untuk memecah masalah, alasan dan menguji jawaban yang berbeda dan mencapai solusi akhir. Sebelumnya, model penalaran Openai menyembunyikan rantai pemikiran mereka dan hanya menghasilkan gambaran tingkat tinggi dari langkah-langkah penalaran. Ini menyulitkan pengguna dan pengembang untuk memahami logika penalaran model dan mengubah instruksi dan diminta untuk mengarahkannya ke arah yang benar.
Openai mempertimbangkan rantai pemikiran sebagai keunggulan kompetitif dan menyembunyikannya untuk mencegah saingan menyalin untuk melatih model mereka. Tetapi dengan R1 dan model terbuka lainnya yang menunjukkan jejak penalaran penuh mereka, kurangnya transparansi menjadi kerugian bagi Openai.
Versi baru O3-Mini menunjukkan versi COT yang lebih rinci. Meskipun kami masih belum melihat token mentah, ini memberikan lebih banyak kejelasan tentang proses penalaran.

Mengapa itu penting untuk aplikasi
Dalam percobaan kami sebelumnya pada O1 dan R1, kami menemukan bahwa O1 sedikit lebih baik dalam menyelesaikan analisis data dan masalah penalaran. Namun, salah satu keterbatasan utama adalah bahwa tidak ada cara untuk mencari tahu mengapa model membuat kesalahan-dan sering membuat kesalahan ketika dihadapkan dengan data dunia nyata yang berantakan yang diperoleh dari web. Di sisi lain, rantai pemikiran R1 memungkinkan kami untuk memecahkan masalah dan mengubah petunjuk kami untuk meningkatkan penalaran.
Misalnya, dalam salah satu percobaan kami, kedua model gagal memberikan jawaban yang benar. Tetapi berkat rantai pemikiran R1 yang terperinci, kami dapat mengetahui bahwa masalahnya bukan dengan model itu sendiri tetapi dengan tahap pengambilan yang mengumpulkan informasi dari web. Dalam percobaan lain, rantai pemikiran R1 dapat memberi kami petunjuk ketika gagal mengurai informasi yang kami berikan, sementara O1 hanya memberi kami gambaran yang sangat kasar tentang bagaimana ia merumuskan responsnya.
Kami menguji model O3-Mini baru pada varian percobaan sebelumnya yang kami jalankan dengan O1. Kami menyediakan model file teks yang berisi harga berbagai saham dari Januari 2024 hingga Januari 2025. File itu berisik dan tidak diformat, campuran teks biasa dan elemen HTML. Kami kemudian meminta model untuk menghitung nilai portofolio yang menginvestasikan $ 140 di 7 saham yang luar biasa pada hari pertama setiap bulan dari Januari 2024 hingga Januari 2025, didistribusikan secara merata di semua saham (kami menggunakan istilah “mag 7” di cepat membuatnya sedikit lebih menantang).
Tempat tidur O3-Mini sangat membantu kali ini. Pertama, model yang beralasan tentang apa MAG 7, menyaring data untuk hanya menyimpan saham yang relevan (untuk membuat masalah menjadi sulit, kami menambahkan beberapa saham non -MAG 7 ke data), menghitung jumlah bulanan untuk berinvestasi di masing -masing saham, dan membuat perhitungan akhir untuk memberikan jawaban yang benar (portofolio akan bernilai sekitar $ 2.200 pada waktu terbaru yang terdaftar dalam data yang kami berikan kepada model).

Dibutuhkan lebih banyak pengujian untuk melihat batas rantai pemikiran baru, karena Openai masih menyembunyikan banyak detail. Tetapi dalam pemeriksaan getaran kami, tampaknya format baru ini jauh lebih berguna.
Apa artinya untuk openai
Ketika Deepseek-R1 dirilis, ia memiliki tiga keunggulan yang jelas dibandingkan model penalaran Openai: itu terbuka, murah dan transparan.
Sejak itu, Openai telah berhasil mempersingkat kesenjangan. Sementara O1 harganya $ 60 per juta token output, O3-mini harganya hanya $ 4,40, sementara mengungguli O1 pada banyak tolok ukur penalaran. Biaya R1 sekitar $ 7 dan $ 8 per juta token pada penyedia AS. (Deepseek menawarkan R1 seharga $ 2,19 per juta token di servernya sendiri, tetapi banyak organisasi tidak akan dapat menggunakannya karena di -host di Cina.)
Dengan perubahan baru pada output COT, OpenAI telah berhasil bekerja di sekitar masalah transparansi.
Masih harus dilihat apa yang akan dilakukan Openai tentang sumber terbuka modelnya. Sejak dirilis, R1 telah diadaptasi, bercabang dan di -host oleh banyak laboratorium dan perusahaan yang berpotensi menjadikannya model penalaran yang disukai untuk perusahaan. CEO Openai Sam Altman baru -baru ini mengakui bahwa ia “berada di sisi sejarah yang salah” dalam debat open source. Kita harus melihat bagaimana realisasi ini akan memanifestasikan dirinya dalam rilis Openai di masa depan.