
Bergabunglah dengan acara yang dipercaya oleh para pemimpin perusahaan selama hampir dua dekade. VB Transform menyatukan orang -orang yang membangun strategi AI perusahaan nyata. Pelajari lebih lanjut
Mistral AI, startup intelijen buatan Prancis, mengumumkan ekspansi luas pada hari Rabu ke infrastruktur AI yang memposisikan perusahaan sebagai jawaban Eropa untuk raksasa komputasi awan Amerika, sementara secara bersamaan meluncurkan model penalaran baru yang menyaingi sistem Openai yang paling canggih.
Perusahaan yang berbasis di Paris mengungkapkan Mistral Compute, platform infrastruktur AI yang komprehensif yang dibangun dalam kemitraan dengan NVIDIA, yang dirancang untuk memberi perusahaan dan pemerintah Eropa alternatif untuk mengandalkan penyedia cloud yang berbasis di AS seperti Amazon Web Services, Microsoft Azure, dan Google Cloud. Langkah ini merupakan pergeseran strategis yang signifikan untuk Mistral dari model AI murni untuk mengendalikan seluruh tumpukan teknologi.
“Perpindahan ini ke infrastruktur AI menandai langkah transformatif untuk AI Mistral, karena memungkinkan kita untuk mengatasi vertikal kritis dari rantai nilai AI,” kata Arthur Mensch, CEO dan salah satu pendiri Mistral AI. “Dengan perubahan ini muncul tanggung jawab untuk memastikan bahwa solusi kami tidak hanya mendorong inovasi dan adopsi AI, tetapi juga menjunjung tinggi otonomi teknologi Eropa dan berkontribusi pada kepemimpinan keberlanjutannya.”
Bagaimana model penalaran yang dibangun secara mistral yang berpikir dalam bahasa apa pun
Bersamaan dengan pengumuman infrastruktur, Mistral meluncurkan serangkaian model penalaran Magistral-sistem AI yang mampu berpikiran logis selangkah demi selangkah mirip dengan model O1 Openai dan Deepseek R1 China. Tetapi Guillaume Lample, kepala ilmuwan Mistral, mengatakan pendekatan perusahaan berbeda dari pesaing dengan cara yang penting.
“Kami melakukan segalanya dari awal, pada dasarnya karena kami ingin mempelajari keahlian yang kami miliki, seperti, fleksibilitas dalam apa yang kami lakukan,” kata Lample kepada saya dalam sebuah wawancara eksklusif. “Kami benar -benar berhasil, seperti, sangat, sangat efisien pada pipa pembelajaran penguatan online yang lebih kuat.”
Tidak seperti pesaing yang sering menyembunyikan proses penalaran mereka, model Mistral menampilkan rantai penuh pemikiran mereka kepada pengguna – dan yang terpenting, dalam bahasa asli pengguna daripada default ke bahasa Inggris. “Di sini kita memiliki rantai penuh pemikiran yang diberikan kepada pengguna, tetapi dalam bahasa mereka sendiri, sehingga mereka benar -benar dapat membacanya, lihat apakah itu masuk akal,” Lample menjelaskan.
Perusahaan ini merilis dua versi: Magistral Small, sebuah model open-source parameter 24 miliar, dan Magistral Medium, sistem kepemilikan yang lebih kuat yang tersedia melalui Mistral's API.
Mengapa Model AI Mistral memperoleh negara adidaya yang tidak terduga selama pelatihan
Model menunjukkan kemampuan mengejutkan yang muncul selama pelatihan. Terutama, Magistral Media mempertahankan kemampuan penalaran multimoda-kapasitas untuk menganalisis gambar-meskipun proses pelatihan hanya berfokus pada masalah matematika dan pengkodean berbasis teks.
“Sesuatu yang kami sadari, tidak secara tidak sengaja, tetapi sesuatu yang benar -benar tidak kami harapkan, adalah bahwa jika pada akhir pelatihan pembelajaran penguatan, Anda mencolokkan kembali encoder penglihatan awal, maka Anda tiba -tiba, agak entah dari mana, melihat model dapat melakukan penalaran melalui gambar,” kata Lample.
Model-model juga memperoleh kemampuan panggilan fungsi yang canggih, secara otomatis melakukan pencarian internet multi-langkah dan eksekusi kode untuk menjawab pertanyaan yang kompleks. “Apa yang akan Anda lihat adalah model yang melakukan ini, berpikir, kemudian menyadari, oke, informasi ini mungkin diperbarui. Biarkan saya menyukai pencarian web,” Lample menjelaskan. “Ini akan mencari di internet seperti, dan kemudian itu benar -benar akan melewati hasilnya, dan itu akan menghasilkannya, dan itu akan mengatakan, mungkin, mungkin jawabannya tidak ada dalam hasil ini. Biarkan saya mencari lagi.”
Perilaku ini muncul secara alami tanpa pelatihan khusus. “Itu adalah sesuatu yang ada pada hal -hal yang harus dilakukan atau tidak, tetapi kami menemukan bahwa itu benar -benar terjadi secara alami. Jadi itu adalah kejutan yang sangat menyenangkan bagi kami,” kata Lample.
Terobosan teknik yang membuat pelatihan Mistral lebih cepat daripada pesaing
Tim teknis Mistral mengatasi tantangan rekayasa yang signifikan untuk menciptakan apa yang digambarkan Lampes sebagai terobosan dalam infrastruktur pelatihan. Perusahaan mengembangkan sistem untuk “pembelajaran penguatan online” yang memungkinkan model AI untuk terus meningkat saat menghasilkan respons, daripada mengandalkan data pelatihan yang sudah ada sebelumnya.
Inovasi utama melibatkan pembaruan model sinkronisasi di ratusan unit pemrosesan grafis (GPU) secara real-time. “Apa yang kami lakukan adalah bahwa kami menemukan cara untuk melepaskan model melalui GPU. Maksud saya, dari GPU ke GPU,” Lample menjelaskan. Ini memungkinkan sistem untuk memperbarui bobot model di berbagai kelompok GPU dalam hitungan detik daripada jam yang biasanya diperlukan.
“Tidak ada infrastruktur open source yang akan melakukan ini dengan benar,” kata Lample. “Biasanya, ada banyak upaya open source untuk melakukan ini, tetapi sangat lambat. Di sini, kami sangat fokus pada efisiensi.”
Proses pelatihan terbukti jauh lebih cepat dan lebih murah daripada pra-pelatihan tradisional. “Itu jauh lebih murah daripada pelatihan pra reguler. Pra pelatihan adalah sesuatu yang akan memakan waktu berminggu -minggu atau berbulan -bulan di GPU lainnya. Di sini, kami tidak dekat dengan ini. Rasanya, saya bergantung pada berapa banyak orang yang kami pakai. Tapi itu lebih seperti, rasanya, cukup kurang dari satu minggu,” kata Lample.
NVIDIA melakukan 18.000 chip untuk kemerdekaan AI Eropa
Mistral Compute Platform akan berjalan pada 18.000 chip Grace Blackwell terbaru NVIDIA, yang awalnya bertempat di pusat data di Essonne, Prancis, dengan rencana ekspansi di seluruh Eropa. CEO NVIDIA Jensen Huang menggambarkan kemitraan ini sebagai hal yang penting bagi kemerdekaan teknologi Eropa.
“Setiap negara harus membangun AI untuk negara mereka sendiri, di negara mereka,” kata Huang pada pengumuman bersama di Paris. “Dengan AI Mistral, kami sedang mengembangkan model dan pabrik AI yang berfungsi sebagai platform berdaulat bagi perusahaan di seluruh Eropa untuk meningkatkan intelijen di seluruh industri.”
Huang memproyeksikan bahwa kapasitas komputasi AI Eropa akan meningkat sepuluh kali lipat selama dua tahun ke depan, dengan lebih dari 20 “pabrik AI” yang direncanakan di seluruh benua. Beberapa fasilitas ini akan memiliki lebih dari sekadar gigawatt kapasitas, berpotensi peringkat di antara pusat data terbesar di dunia.
Kemitraan ini melampaui infrastruktur untuk memasukkan pekerjaan Nvidia dengan perusahaan AI Eropa lainnya dan kebingungan, perusahaan pencarian, untuk mengembangkan model penalaran dalam berbagai bahasa Eropa di mana data pelatihan sering terbatas.
Bagaimana Mistral Berencana Untuk Memecahkan Masalah Lingkungan dan Kedaulatan AI
Mistral Compute membahas dua kekhawatiran utama tentang pengembangan AI: dampak lingkungan dan kedaulatan data. Platform memastikan bahwa pelanggan Eropa dapat menyimpan informasi mereka di dalam perbatasan UE dan di bawah yurisdiksi Eropa.
Perusahaan ini telah bermitra dengan Badan Nasional Prancis untuk Transisi Ekologis dan Carbone 4, sebuah konsultasi iklim terkemuka, untuk menilai dan meminimalkan jejak karbon dari model AI -nya sepanjang siklus hidup mereka. Mistral berencana untuk memberi daya pada pusat datanya dengan sumber energi dekarbonisasi.
“Dengan memilih Eropa untuk lokasi situs kami, kami memberi diri kami kemampuan untuk mendapatkan manfaat dari sumber energi yang sebagian besar dekarbonisasi,” kata perusahaan itu dalam pengumumannya.
Keuntungan Kecepatan Memberikan Model Penalaran Mistral Tepi Praktis
Pengujian awal menunjukkan model penalaran Mistral memberikan kinerja kompetitif sambil mengatasi kritik umum terhadap sistem yang ada – kecepatan. Model penalaran saat ini dari Openai dan yang lainnya dapat membutuhkan waktu beberapa menit untuk menanggapi pertanyaan yang kompleks, membatasi utilitas praktis mereka.
“Salah satu hal yang biasanya tidak disukai orang tentang model penalaran ini adalah bahwa meskipun cerdas, kadang -kadang membutuhkan banyak waktu,” kata Lample. “Di sini Anda benar -benar melihat output hanya dalam beberapa detik, kadang -kadang kurang dari lima detik, kadang -kadang bahkan kurang dari ini. Dan itu mengubah pengalaman.”
Keuntungan kecepatan bisa terbukti penting untuk adopsi bisnis, di mana menit menunggu untuk tanggapan AI menciptakan kemacetan alur kerja.
Apa arti taruhan infrastruktur Mistral untuk kompetisi AI global
Perpindahan Mistral ke infrastruktur menempatkannya dalam persaingan langsung dengan raksasa teknologi yang telah mendominasi pasar komputasi awan. Amazon Web Services, Microsoft Azure, dan Google Cloud saat ini mengontrol sebagian besar infrastruktur cloud secara global, sementara pemain baru seperti Coreweave telah memperoleh tanah secara khusus dalam beban kerja AI.
Pendekatan perusahaan berbeda dari pesaing dengan menawarkan solusi lengkap, terintegrasi secara vertikal – dari infrastruktur perangkat keras hingga model AI hingga layanan perangkat lunak. Ini termasuk Mistral AI Studio untuk pengembang, LE Chat untuk produktivitas perusahaan, dan kode Mistral untuk bantuan pemrograman.
Analis industri melihat strategi Mistral sebagai bagian dari tren yang lebih luas menuju pengembangan AI regional. “Eropa sangat perlu meningkatkan infrastruktur AI jika ingin tetap kompetitif secara global,” kata Huang, menggemakan kekhawatiran yang disuarakan oleh para pembuat kebijakan Eropa.
Pengumuman ini datang ketika pemerintah Eropa semakin khawatir tentang ketergantungan mereka pada perusahaan teknologi Amerika untuk infrastruktur AI kritis. Uni Eropa telah berkomitmen € 20 miliar untuk membangun AI “gigafactories” di seluruh benua, dan kemitraan Mistral dengan Nvidia dapat membantu mempercepat rencana tersebut.
Pengumuman ganda Mistral tentang infrastruktur dan kemampuan model menandakan ambisi perusahaan untuk menjadi platform AI yang komprehensif daripada hanya penyedia model lainnya. Dengan dukungan dari Microsoft dan investor lainnya, perusahaan telah mengumpulkan lebih dari $ 1 miliar dan terus mencari dana tambahan untuk mendukung ruang lingkup yang diperluas.
Tapi Lample melihat kemungkinan yang lebih besar di depan untuk model penalaran. “Saya pikir ketika saya melihat kemajuan secara internal, dan saya pikir pada beberapa tolok ukur, model itu mendapatkan akurasi plus 5% setiap minggu untuk suka, mungkin seperti, enam minggu dalam semua,” katanya. “Jadi itu membaik dengan sangat cepat, ada banyak, banyak, maksud saya, banyak banyak suka, Anda tahu, ide -ide kecil yang dapat Anda pikirkan yang akan meningkatkan kinerja.”
Keberhasilan tantangan Eropa ini terhadap dominasi AI Amerika pada akhirnya tergantung pada apakah pelanggan menghargai kedaulatan dan keberlanjutan yang cukup untuk beralih dari penyedia mapan. Untuk saat ini, setidaknya, mereka punya pilihan.