
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Ada raja baru di atas takhta model pengkodean AI: hari ini, unit penelitian AI DeepMind Google meluncurkan edisi Gemini 2.5 Pro “I/O”, versi baru dari hit Gemini 2.5 Pro Multimodal Language Model (LLM) yang dirilis kembali pada bulan Maret yang pernah kami bawa!
Memang, tolok ukur awal yang dirilis oleh perusahaan menunjukkan Google telah memimpin – untuk pertama kalinya sejak balapan AI generatif dimulai dengan sungguh -sungguh dengan peluncuran chatgpt akhir 2022 – di atas semua model lain pada setidaknya satu tolok ukur pengkodean penting.
Versi baru, berlabel “Gemini-12.5-Pro-Preview-05-06,” menggantikan rilis 03-25 sebelumnya dan sekarang tersedia untuk pengembang indie di Google AI Studio dan untuk perusahaan di platform cloud AI Vertex, serta untuk pengguna individu di aplikasi Gemini. Posting blog Google mengatakan itu juga memberi kekuatan pada kanvas aplikasi seluler Gemini dan fitur lainnya.
Versi baru ini Powers fitur pengembangan dalam aplikasi seperti Gemini 95, di mana model ini membantu mencocokkan gaya visual di seluruh komponen secara otomatis. Ini juga memungkinkan alur kerja seperti mengubah video YouTube menjadi aplikasi pembelajaran berfitur lengkap dan membuat komponen yang sangat bergaya-seperti pemutar video yang responsif atau dikte animasi UI-dengan sedikit atau tanpa pengeditan CSS manual.
Ini adalah model hak milik, yang berarti perusahaan harus membayar Google untuk menggunakannya dan mengaksesnya hanya melalui layanan web Google. Namun, itu tidak mengubah batas harga atau laju; Pengguna Gemini 2.5 Pro saat ini akan secara otomatis dialihkan ke model yang diperbarui yang harganya $ 1,25/$ 10 per juta token masuk/keluar (untuk panjang konteks 200.000 token) dibandingkan dengan Claude 3,7 soneta $ 3/$ 15.
Perusahaan membingkai langkah ini-menjelang konferensi pengembang I/O tahunan Google (input/output) akhir bulan ini di Mountain View dan online, 20-21 Mei-sebagai tanggapan terhadap umpan balik masyarakat yang kuat di sekitar utilitas praktis Gemini dalam pembuatan kode dunia nyata dan desain antarmuka.
Logan Kilpatrick, Manajer Produk Senior untuk Gemini API dan Google AI Studio, dikonfirmasi dalam posting blog pengembang bahwa pembaruan tersebut juga membahas umpan balik pengembang utama di sekitar panggilan fungsi, dengan peningkatan pengurangan kesalahan dan memicu keandalan.
Skor teratas dari penilai manusia saat menghasilkan aplikasi web
Di papan peringkat Webdev Arena, metrik pihak ketiga yang menempati peringkat model berdasarkan preferensi manusia berdasarkan kemampuan mereka untuk menghasilkan aplikasi web yang menarik secara visual dan fungsional, Gemini 2.5 Pro Preview (05-06) kini telah melampaui soneta Claude 3.7 Anthropic di tempat nomor satu.
Versi baru mencetak 1499,95 di papan peringkat, menempatkannya jauh di depan Sonnet 3.7 1377.10. Model Gemini 2.5 Pro (03-25) sebelumnya diadakan di tempat ketiga dengan skor 1278,96, yang berarti edisi I/O mewakili lompatan 221 poin.

Seperti dicatat oleh pengguna daya AI “Lisan al Gaib” di X, bahkan Openai's GPT-4O (“O3”) tidak dapat menggantikan Sonnet 3.7, menyoroti pentingnya kemajuan Gemini.
Dorongan kinerja Gemini mencerminkan peningkatan keandalan, estetika, dan kegunaan dalam outputnya.
Sudah memenangkan sambutan hangat
Beberapa pengembang dan pemimpin platform telah menyoroti peningkatan keandalan dan aplikasi model dalam skenario produksi.
Silas Alberti dari Cognition mencatat bahwa Gemini 2.5 Pro adalah model pertama yang berhasil menyelesaikan refactoring kompleks dari sistem perutean backend, menunjukkan jenis pengambilan keputusan yang diharapkan dari pengembang senior.
Michael Truell, CEO kursor alat pengkodean AI, mengatakan pengujian internal menunjukkan penurunan yang nyata dalam kegagalan panggilan alat, masalah yang sebelumnya dicatat. Dia mengharapkan pengguna untuk menemukan versi terbaru secara signifikan lebih efektif di lingkungan langsung. Kursor telah mengintegrasikan Gemini 2.5 Pro ke dalam agen kode sendiri, yang mencerminkan bagaimana pengembang menggunakan model sebagai komponen kunci dalam alur kerja pengembang yang lebih cerdas.
Michele Catasta, presiden Replit, menggambarkan Gemini 2.5 Pro sebagai model perbatasan terbaik untuk menyeimbangkan kemampuan dengan latensi. Komentarnya menunjukkan bahwa Replit sedang mempertimbangkan integrasi model ke dalam alatnya sendiri, terutama untuk tugas -tugas di mana responsif dan keandalan yang tinggi sangat penting.
Demikian pula, pendidik AI dan pendiri Blueshell Private AI Chatbot Paul Couvert mencatat pada X bahwa “Kode dan kemampuan generasi UI sangat mengesankan.”
Dan seperti Pietro Schirano, CEO AI Art Tool Everart, mencatat pada X, edisi Gemini 2.5 Pro I/O yang baru mampu menghasilkan simulasi interaktif dari meme “1 gorila vs 100 orang” yang telah beredar di media sosial yang baru -baru ini dari satu prompt.
Memamerkan interaktif lain Tetris-Game teka -teki gaya dengan efek suara yang berfungsi dilaporkan dibuat dalam waktu kurang dari satu menit, x pengguna “Rameshr” (@rezmeram) menulis bahwa “Industri permainan kasual sudah mati !!”
Pengesahan ini menambah bobot pada klaim DeepMind tentang perbaikan praktis dan dapat mendorong adopsi yang lebih luas di seluruh platform pengembang.
Aplikasi dan program lengkap dari satu prompt teks
Salah satu fitur yang menonjol dari pembaruan adalah kemampuannya untuk membangun aplikasi web atau simulasi interaktif penuh dari satu prompt.
Ini selaras dengan visi DeepMind untuk menyederhanakan proses pembuatan prototipe dan pengembangan.
Demonstrasi dalam aplikasi Gemini menampilkan bagaimana pengguna dapat mengubah pola visual atau petunjuk tematik menjadi kode yang dapat digunakan, menurunkan penghalang masuk untuk masuk untuk pengembang dan tim yang berorientasi desain yang bereksperimen dengan ide-ide baru.
Meskipun arsitektur dan perubahan di bawah-tudung Gemini 2.5 Pro belum dirinci secara publik, penekanannya tetap pada memungkinkan pengalaman pembangunan yang lebih cepat dan lebih intuitif.
Dengan bersandar pada kekuatannya dalam pembuatan kode dan input multimodal, Gemini 2.5 Pro diposisikan kurang sebagai hal baru dan lebih sebagai alat praktis untuk tantangan pengkodean dunia nyata. Rilis awal mencerminkan niat yang jelas dari Google DeepMind untuk memenuhi permintaan pengembang dan mempertahankan momentum menjelang pengumuman konferensi utamanya.