
Bergabunglah dengan buletin harian dan mingguan kami untuk mendapatkan pembaruan terkini dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari Lebih Lanjut
Bahkan ketika mitra investasi besarnya, OpenAI, terus mengumumkan model penalaran yang lebih kuat seperti seri o3 terbaru, Microsoft tidak tinggal diam. Sebaliknya, mereka malah mengejar pengembangan model kecil yang lebih kuat yang dirilis dengan mereknya sendiri.
Seperti yang diumumkan oleh beberapa peneliti dan ilmuwan AI Microsoft saat ini dan sebelumnya di X, Microsoft merilis model Phi-4 sebagai proyek sumber terbuka sepenuhnya dengan bobot yang dapat diunduh di Hugging Face, komunitas berbagi kode AI.
“Kami benar-benar kagum dengan tanggapannya [the] rilis phi-4,” tulis insinyur riset utama Microsoft AI Shital Shah di X. “Banyak orang telah meminta kami untuk merilis bobot. [A f]saya bahkan mengunggah beban phi-4 bajakan di HuggingFace…Nah, tunggu apa lagi. Kami merilis hari ini [the] model phi-4 resmi di HuggingFace! Dengan lisensi MIT!!”
Bobot mengacu pada nilai numerik yang menentukan bagaimana model bahasa AI, kecil atau besar, memahami dan mengeluarkan bahasa dan data. Bobot model ditentukan oleh proses pelatihannya, biasanya melalui pembelajaran mendalam tanpa pengawasan, yang selama proses tersebut menentukan keluaran apa yang harus diberikan berdasarkan masukan yang diterimanya. Bobot model dapat disesuaikan lebih lanjut oleh peneliti manusia dan pembuat model dengan menambahkan pengaturan mereka sendiri, yang disebut bias, ke model selama pelatihan. Suatu model umumnya tidak dianggap sepenuhnya open-source kecuali bobotnya telah dipublikasikan, karena hal inilah yang memungkinkan peneliti manusia lainnya untuk mengambil model tersebut dan sepenuhnya menyesuaikannya atau mengadaptasinya untuk tujuan mereka sendiri.
Meskipun Phi-4 sebenarnya diungkapkan oleh Microsoft bulan lalu, penggunaannya awalnya terbatas pada platform pengembangan Azure AI Foundry baru dari Microsoft.
Kini, Phi-4 tersedia di luar layanan eksklusif tersebut bagi siapa saja yang memiliki akun Hugging Face, dan dilengkapi dengan Lisensi MIT yang permisif, yang memungkinkannya digunakan untuk aplikasi komersial juga.
Rilis ini memberi peneliti dan pengembang akses penuh ke 14 miliar parameter model, memungkinkan eksperimen dan penerapan tanpa kendala sumber daya yang sering dikaitkan dengan sistem AI yang lebih besar.
Pergeseran menuju efisiensi dalam AI
Phi-4 pertama kali diluncurkan pada platform Azure AI Foundry milik Microsoft pada bulan Desember 2024, di mana pengembang dapat mengaksesnya berdasarkan perjanjian lisensi penelitian.
Model ini dengan cepat mendapatkan perhatian karena mengungguli banyak model yang lebih besar di berbagai bidang seperti penalaran matematika dan pemahaman bahasa multitask, sekaligus memerlukan sumber daya komputasi yang jauh lebih sedikit.
Arsitektur model yang disederhanakan dan fokusnya pada penalaran dan logika dimaksudkan untuk mengatasi meningkatnya kebutuhan akan kinerja tinggi dalam AI yang tetap efisien dalam lingkungan dengan keterbatasan komputasi dan memori. Dengan rilis sumber terbuka di bawah Lisensi MIT yang permisif, Microsoft membuat Phi-4 lebih mudah diakses oleh lebih banyak peneliti dan pengembang, bahkan peneliti dan pengembang komersial, yang menandakan potensi perubahan dalam cara industri AI mendekati desain dan penerapan model.
Apa yang membuat Phi-4 menonjol?
Phi-4 unggul dalam tolok ukur yang menguji penalaran tingkat lanjut dan kemampuan khusus domain. Sorotan meliputi:
• Mendapat skor lebih dari 80% dalam tolok ukur yang menantang seperti MATH dan MGSM, mengungguli model yang lebih besar seperti Google Gemini Pro dan GPT-4o-mini.
• Kinerja unggul dalam tugas-tugas penalaran matematis, kemampuan penting untuk bidang-bidang seperti keuangan, teknik, dan penelitian ilmiah.
• Hasil yang mengesankan dalam HumanEval untuk pembuatan kode fungsional, menjadikannya pilihan tepat untuk pemrograman berbantuan AI.
Selain itu, arsitektur dan proses pelatihan Phi-4 dirancang dengan mempertimbangkan presisi dan efisiensi. Model transformator khusus dekodernya yang padat dengan 14 miliar parameter dilatih pada 9,8 triliun token kumpulan data yang dikurasi dan sintetis, termasuk:
• Dokumen yang tersedia untuk umum disaring secara ketat kualitasnya.
• Data sintetik bergaya buku teks yang berfokus pada matematika, pengkodean, dan penalaran akal sehat.
• Buku akademis dan kumpulan data Tanya Jawab berkualitas tinggi.
Data pelatihan juga mencakup konten multibahasa (8%), meskipun model ini terutama dioptimalkan untuk aplikasi berbahasa Inggris.
Penciptanya di Microsoft mengatakan bahwa proses keselamatan dan penyelarasan, termasuk penyesuaian yang diawasi dan optimalisasi preferensi langsung, memastikan kinerja yang kuat sekaligus mengatasi kekhawatiran tentang keadilan dan keandalan.
Keuntungan sumber terbuka
Dengan membuat Phi-4 tersedia di Hugging Face dengan bobot penuh dan Lisensi MIT, Microsoft membukanya bagi bisnis untuk digunakan dalam operasi komersial mereka.
Pengembang kini dapat memasukkan model tersebut ke dalam proyek mereka atau menyempurnakannya untuk aplikasi tertentu tanpa memerlukan sumber daya komputasi yang ekstensif atau izin dari Microsoft.
Langkah ini juga sejalan dengan tren model AI dasar yang bersifat open source untuk mendorong inovasi dan transparansi. Tidak seperti model kepemilikan, yang seringkali terbatas pada platform atau API tertentu, sifat sumber terbuka Phi-4 memastikan aksesibilitas dan kemampuan beradaptasi yang lebih luas.
Menyeimbangkan keamanan dan kinerja
Dengan dirilisnya Phi-4, Microsoft menekankan pentingnya pengembangan AI yang bertanggung jawab. Model ini menjalani evaluasi keamanan yang ekstensif, termasuk pengujian permusuhan, untuk meminimalkan risiko seperti bias, pembuatan konten berbahaya, dan misinformasi.
Namun, pengembang disarankan untuk menerapkan perlindungan tambahan untuk aplikasi berisiko tinggi dan mendasarkan keluaran pada informasi kontekstual yang terverifikasi ketika menerapkan model dalam skenario sensitif.
Implikasinya terhadap lanskap AI
Phi-4 menantang tren yang ada dalam menskalakan model AI ke ukuran yang sangat besar. Hal ini menunjukkan bahwa model yang lebih kecil dan dirancang dengan baik dapat mencapai hasil yang sebanding atau lebih unggul di bidang-bidang utama.
Efisiensi ini tidak hanya mengurangi biaya namun juga menurunkan konsumsi energi, menjadikan kemampuan AI tingkat lanjut lebih mudah diakses oleh organisasi skala menengah dan perusahaan dengan anggaran komputasi terbatas.
Saat pengembang mulai bereksperimen dengan model ini, kita akan segera melihat apakah model ini dapat berfungsi sebagai alternatif yang layak untuk menyaingi model komersial dan sumber terbuka dari OpenAI, Anthropic, Google, Meta, DeepSeek, dan banyak lainnya.