
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Hanya beberapa bulan setelah merilis Gemini 2.0 dan kebangkitan Deepseek, Google mengumumkan “model paling cerdas”, Gemini 2.5, yang mampu beralasan dan dengan kinerja dan akurasi yang lebih baik.
Gemini 2.5 datang tiga bulan setelah Google merilis keluarga model paling cerdas yang sebelumnya, Gemini 2.0 yang memperkenalkan kasus penalaran dan penggunaan agen. Model baru ini tersedia sebagai Gemini 2.5 Pro (Eksperimental) di Studio AI Google dan untuk pengguna Lanjutan Gemini di antarmuka obrolan Gemini. Ini akan segera tersedia di Vertex AI.
Koray Kavukcuoglu, CTO di Google DeepMind, mengatakan dalam sebuah posting blog bahwa Gemini 2.5 mewakili langkah selanjutnya dalam tujuan Google untuk membuat “AI Smarter dan lebih mampu beralasan.”
“Sekarang, dengan Gemini 2.5, kami telah mencapai tingkat kinerja baru dengan menggabungkan model dasar yang ditingkatkan secara signifikan dengan peningkatan pasca-pelatihan,” tulis Kavukcuoglu. “Ke depan, kami sedang membangun kemampuan berpikir ini secara langsung ke semua model kami, sehingga mereka dapat menangani masalah yang lebih kompleks dan mendukung agen yang lebih mampu dan sadar konteks.”
Lebih banyak konteks dan pemahaman
Seperti Gemini 2.0 dan Gemini 2.0 Flash Thinking, Gemini 2.5 Pro “berpikir” sebelum merespons. Model baru ini dapat menangani input multimodal dari teks, audio, gambar, video, dan set data besar. Gemini 2.5 Pro juga dapat memahami seluruh repositori kode untuk proyek pengkodean.
Gemini 2.5 Pro menawarkan beberapa jendela konteks terbesar yang tersedia untuk model eksperimental di Gemini. Ini dikirimkan dengan jendela konteks 1 juta token tetapi akan segera berkembang menjadi 2 juta token. Google AI Studio Product Manager Logan Kilpatrick memposting di X bahwa Gemini 2.5 Pro adalah “model eksperimental pertama dengan batas tingkat yang lebih tinggi + penagihan.”
Google berencana untuk melepaskan harga untuk model Gemini 2.5 segera.
Kinerja pengkodean dan penalaran yang ditingkatkan
Google mengatakan model tersebut mengarah pada tes benchmark penalaran lanjutan. Perusahaan itu mengatakan Gemini 2.5 Pro “memimpin dalam pertandingan pertandingan dan sains seperti GPQA dan AIME 2025.” Kavukcuoglu mengatakan model itu juga mencetak “canggih 18,8% di seluruh model tanpa penggunaan alat pada ujian terakhir umat manusia,” sebuah dataset yang bertujuan untuk menangkap pengetahuan dan penalaran manusia.

Gemini 2.5 Pro juga berkinerja kuat pada tugas pengkodean dan mendapat skor lebih baik daripada Gemini 2.0 dalam tolok ukur tertentu. Google mencatat model baru “unggul dalam membuat aplikasi web yang menarik secara visual dan aplikasi kode agen, bersama dengan transformasi dan pengeditan kode.”
Pasar yang lebih kompetitif
Gemini 2.5 Pro memasuki keruntuhan model penalaran dalam lingkungan yang berubah secara signifikan daripada yang dilakukan Gemini 2.0 pada bulan Desember. Pelepasan Deepseek's Besar Model Bahasa (LLM) Deepseek-R1 menunjukkan bahwa model yang kuat dapat berkinerja baik di sebagian kecil dari pelatihan dan biaya komputasi. Selain itu, Deepseek menunjukkan bahwa model open-source dapat bersaing dengan LLMs sumber yang lebih tertutup, seperti model O1 dan O3 Openai.
Selain penawaran model Deepseek yang terus berkembang, Google harus bersaing dengan model penalaran Openai. Sementara model terbaru dari Openai adalah GPT-4.5-bukan model penalaran-perusahaan masih diharapkan untuk mengembangkan lebih banyak model penalaran segera.
Gemini 2.5 adalah Model baru kedua Google bulan ini. Pada bulan Maret, perusahaan merilis versi terbaru dari model bahasa kecilnya, Gemma 3yang menawarkan model konteks 128.000 token dan terbaik untuk digunakan di perangkat saat bepergian.