
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Startup kecerdasan buatan Elon Musk Xai telah meluncurkan Grok 3, model AI terbarunya yang diklaim perusahaan mengungguli pesaing terkemuka di seluruh tolok ukur teknis utama. Pengumuman ini menandai peningkatan signifikan dalam perlombaan untuk mengembangkan sistem AI yang lebih kuat.
Peluncuran datang hanya beberapa hari setelah Musk gagal $ 97,4 miliar tawaran untuk mengakuisisi Openai, perusahaan yang ia ikuti dengan Sam Altman pada tahun 2015. Selama demonstrasi darat di X, Musk mengkarakterisasi Grok 3 sebagai “urutan besarnya lebih mampu daripada Grok 2” dan menekankan kemampuannya untuk bernalar melalui masalah yang kompleks.
Pengujian awal tampaknya mendukung beberapa klaim Xai. Model ini menduduki puncak papan peringkat Chatbot Arena yang berpengaruh, mencetak lebih tinggi dari GPT-4O Openai, model V3 Google dan V3 Deepseek dalam pengujian pengguna buta. Tolok ukur yang diterbitkan menunjukkan Grok 3 mencapai skor superior dalam matematika (AIME '24), penalaran ilmiah (GPQA) dan tugas pengkodean.
Instrastruktur komputasi besar -besaran Grok 3: 200.000 GPU dan pusat data baru
“Grok 3 jelas memiliki kemampuan pemikiran canggih,” tulis mantan peneliti Openai Andrej Karpathy dalam sebuah posting X setelah pengujian akses awal. “Beberapa model mendapatkan hal ini dengan andal. Model pemikiran Openai teratas mendapatkannya juga, tetapi semua Deepseek-R1, Gemini 2.0 Flash Thinking, dan Claude tidak. ”
Pengembangan model membutuhkan sumber daya komputasi besar -besaran. XAI menggandakan cluster GPU -nya menjadi 200.000 chip NVIDIA untuk pelatihan, bertempat di pusat data Memphis baru. Investasi infrastruktur ini menyoroti meningkatnya tuntutan komputasi pengembangan AI tingkat lanjut, karena perusahaan berlomba untuk membangun sistem yang lebih mampu.
Saya diberi akses awal ke Grok 3 sebelumnya hari ini, membuat saya pikir salah satu dari sedikit pertama yang bisa menjalankan cek getaran cepat.
Pemikiran
– Andrej Karpathy (@karpathy) 18 Februari 2025
✅ Pertama, GROK 3 jelas memiliki model pemikiran seni yang berkeliling (tombol “Think”) dan melakukan dengan baik di luar kotak di pemukim saya dari Catan… pic.twitter.com/qiruan1ifd
DeepSearch dan Advanced Reasoning: Bagaimana Grok 3 bertujuan untuk mengakali Chatgpt dan Google Gemini
Inovasi utama adalah fitur “DeepSearch” Grok 3, yang menggabungkan pencarian web dengan kemampuan penalaran untuk menganalisis informasi dari berbagai sumber. Sistem ini juga mencakup mode khusus untuk pemecahan masalah yang kompleks, termasuk fungsi “berpikir” yang menunjukkan proses penalaran dan mode “otak besar” yang mengalokasikan daya komputasi tambahan untuk tugas-tugas sulit.
“Hal yang benar -benar diperhatikan dalam AI adalah kecepatan belajar. Dan @xai belajar jauh lebih cepat dari yang lain, ”veteran industri teknologi yang memposting Robert Scoble, mengutip percakapan dengan salah satu pendiri Apple Siri Tom Gruber.
GROK 3 tolok ukur.
Hal yang benar -benar diperhatikan dalam AI adalah kecepatan belajar. Dan @xai adalah belajar lebih cepat dari yang lain.
Siapa yang bilang?
Pendiri Apple Siri Tom Gruber. Dia memberi tahu saya saat makan malam satu dekade yang lalu bahwa itu adalah hal terpenting yang harus diperhatikan. pic.twitter.com/ywcijsn9pu
– Robert Scoble (@scobleizer) 18 Februari 2025
Namun, beberapa keterbatasan muncul selama pengujian. Karpathy mencatat bahwa model tersebut terkadang membuat kutipan dan berjuang dengan jenis humor dan tugas penalaran etis tertentu. Tantangan-tantangan ini adalah umum di seluruh sistem AI saat ini dan menyoroti kesulitan yang berkelanjutan dalam mengembangkan kecerdasan buatan yang benar-benar seperti manusia.
CEO Scale.ai Alexandr Wang memuji rilis, tweeting: “Grok 3 adalah model terbaik baru di dunia dari tim @xai!” Dia mencatat penampilannya yang unggul pada berbagai tolok ukur dan menyatakan antusiasme untuk kolaborasi di masa depan.
Grok 3 adalah model terbaik baru di dunia dari @xai tim!
Grok 3 peringkat #1 di chatbot arena dengan celah besar, dan skor mengesankan pada pretraining dan penalaran eval.
Selamat untuk @elonMusk @ibab @jimmybajimmyba @Yuhu_ai_
Menantikan lebih banyak kemitraan di Grok4 & Beyond? pic.twitter.com/brpgz17p51
– Alexandr Wang (@alexandr_wang) 18 Februari 2025
Persaingan Industri AI Memanas: Apa Arti Peluncuran Grok 3 untuk Openai, Deepseek dan Masa Depan Kecerdasan Buatan
Model ini akan tersedia melalui Langganan Premium+ X ($ 40/bulan) dan layanan “SuperGrok” mandiri baru ($ 30/bulan). Akses API Enterprise direncanakan untuk beberapa minggu mendatang.
Peluncuran ini mengintensifkan persaingan dalam industri AI, terutama karena startup China Deepseek baru -baru ini menunjukkan kinerja yang sebanding dengan persyaratan komputasi yang dilaporkan lebih rendah. Perkembangan ini juga menimbulkan pertanyaan tentang keberlanjutan perlombaan senjata komputasi di AI, karena perusahaan berinvestasi miliaran dalam infrastruktur perangkat keras yang semakin kuat.

Musk menekankan bahwa Grok 3 tetap dalam beta, dengan perbaikan yang diharapkan “hampir setiap hari.” Perusahaan berencana untuk menambahkan kemampuan interaksi suara dalam beberapa minggu dan akan membuka sumber model sebelumnya, Grok 2, setelah versi baru stabil.
Namun mungkin aspek yang paling jitu dari debut Grok 3 bukanlah spesifikasi teknis atau skor tolok ukurnya, tetapi apa yang diwakilinya: ketegangan meningkat antara Musk dan mantan rekannya di Openai. Hanya beberapa hari setelah tawarannya yang gagal $ 97,4 miliar untuk memperoleh Openai, Musk telah meluncurkan model yang menantang supremasi-menunjukkan bahwa dalam perlombaan berisiko tinggi untuk dominasi AI, bahkan pelamar yang ditolak dapat menjadi saingan yang tangguh.