
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Memeluk wajah dan kecerdasan fisik dengan diam-diam meluncurkan PI0 (Pi-Zero) minggu ini, model dasar pertama untuk robot yang menerjemahkan perintah bahasa alami secara langsung ke dalam tindakan fisik.
“PI0 adalah model aksi bahasa visi paling canggih,” Remi Cadene, seorang ilmuwan riset utama di Hugging Face, diumumkan dalam sebuah posting X yang dengan cepat mendapat perhatian di seluruh komunitas AI. “Dibutuhkan perintah bahasa alami sebagai input dan langsung menghasilkan perilaku otonom.”
Rilis ini menandai momen penting dalam robotika: pertama kali model fondasi untuk robot telah tersedia secara luas melalui platform open-source. Sama seperti chatgpt generasi teks yang direvolusi, PI0 bertujuan untuk mengubah bagaimana robot belajar dan melaksanakan tugas.
Masa depan robotika terbuka!
Senang melihat PI0 oleh @physical_int Menjadi model robotika dasar pertama yang bersumber terbuka @huggingface @Lerobothf. Anda sekarang dapat menyempurnakannya pada dataset Anda sendiri.
??? pic.twitter.com/ar8shgyfbv
– Clem? (@Clementdelangue) 4 Februari 2025
Bagaimana PI0 membawa pembelajaran gaya chatgpt ke robotika, membuka tugas kompleks
Model ini, yang awalnya dikembangkan oleh kecerdasan fisik dan sekarang diangkut untuk memeluk platform lerobot Face, dapat melakukan tugas -tugas rumit seperti cucian lipat, meja bussing dan bahan makanan pengepakan – kegiatan yang secara tradisional sangat menantang bagi robot untuk dikuasai.
“Robot hari ini adalah spesialis sempit, diprogram untuk gerakan berulang dalam pengaturan koreografi,” tulis tim peneliti Intelijen Fisik dalam posting pengumuman mereka. “PI0 mengubah itu, memungkinkan robot untuk belajar dan mengikuti instruksi pengguna, membuat pemrograman sesederhana memberi tahu robot apa yang ingin Anda lakukan.”
Teknologi di balik PI0 merupakan pencapaian teknis yang signifikan. Model ini dilatih pada data dari tujuh platform robot yang berbeda dan 68 tugas unik, memungkinkannya untuk menangani semuanya, mulai dari tugas manipulasi halus hingga prosedur multi-langkah yang kompleks. Ini menggunakan teknik baru yang disebut pencocokan aliran untuk menghasilkan lintasan aksi yang halus dan real-time pada 50Hz, membuatnya sangat tepat dan mudah beradaptasi untuk penyebaran dunia nyata.
Teknologi cepat baru mempercepat pelatihan robot dengan 5x, memperluas potensi AI
Membangun di atas yayasan ini, tim juga memperkenalkan “PI0-FAST,” versi yang disempurnakan dari model yang menggabungkan skema tokenisasi baru yang disebut Tokenisasi Urutan Aksi Ruang Ruang (FAST). Versi ini berlatih lima kali lebih cepat dari pendahulunya dan menunjukkan peningkatan generalisasi di berbagai lingkungan dan jenis robot.
Implikasinya untuk industri sangat besar. Fasilitas manufaktur berpotensi memprogram ulang robot untuk tugas -tugas baru melalui instruksi verbal sederhana daripada pengkodean yang kompleks. Gudang dapat menggunakan sistem otomatisasi yang lebih fleksibel yang beradaptasi dengan perubahan kebutuhan. Bahkan usaha kecil mungkin menemukan robotika lebih mudah diakses, karena penghalang pemrograman dan penyebaran menurun secara signifikan.
Namun, tantangan tetap ada. Sementara PI0 merupakan kemajuan yang signifikan, ia masih memiliki keterbatasan. Model ini kadang -kadang berjuang dengan tugas yang sangat kompleks dan membutuhkan sumber daya komputasi yang substansial. Ada juga pertanyaan tentang keandalan dan keamanan dalam pengaturan industri.
Rilis ini datang pada waktu yang penting dalam evolusi industri AI. Ketika perusahaan berlomba untuk mengembangkan dan menggunakan Kecerdasan Umum Buatan (AGI), PI0 merupakan salah satu upaya sukses pertama untuk menjembatani kesenjangan antara model bahasa dan interaksi dunia fisik.
Teknologi ini sekarang tersedia melalui platform Hugging Face, di mana pengembang dapat mengunduh dan menggunakan kebijakan pretrain dengan hanya beberapa baris kode:
Pythonruncopy
policy = Pi0Policy.from_pretrained("lerobot/pi0")
Untuk pengguna perusahaan, aksesibilitas ini dapat mempercepat adopsi robotika canggih di seluruh industri. Perusahaan sekarang dapat menyempurnakan model untuk kasus penggunaan tertentu, berpotensi mengurangi waktu dan biaya yang terkait dengan penyebaran solusi robot.
Mengapa Pemimpin Perusahaan Harus Memperhatikan Robotika Sumber Terbuka
Tim pengembangan juga telah merilis dokumentasi komprehensif dan materi pelatihan, membuat teknologi dapat diakses oleh berbagai pengguna. Demokratisasi teknologi robotika ini dapat mengarah pada aplikasi inovatif di berbagai sektor, dari perawatan kesehatan hingga ritel.
Saat teknologi matang, itu bisa membentuk kembali bagaimana kita berpikir tentang otomatisasi dan interaksi manusia-robot. Kemampuan untuk mengendalikan robot melalui bahasa alami dapat membuat bantuan robot lebih mudah diakses di rumah, rumah sakit, dan usaha kecil – area di mana robotika tradisional telah berjuang untuk mendapatkan daya tarik karena kompleksitas pemrograman.
Dengan rilis ini, masa depan robotik terlihat semakin percakapan, adaptif, dan dapat diakses. Meskipun masih ada pekerjaan yang harus dilakukan, PI0 mewakili langkah yang signifikan menuju menjadikan robot yang serbaguna dan cerdas sebagai realitas praktis daripada fantasi fiksi ilmiah.