
Bergabunglah dengan acara yang dipercaya oleh para pemimpin perusahaan selama hampir dua dekade. VB Transform menyatukan orang -orang yang membangun strategi AI perusahaan nyata. Pelajari lebih lanjut
Tim Peneliti Pembelajaran Mesin Apple telah mengembangkan sistem AI terobosan untuk menghasilkan gambar resolusi tinggi yang dapat menantang dominasi model difusi, teknologi yang memberi daya pada generator gambar populer seperti Dall-E dan Midjourney.
Kemajuan, yang dirinci dalam makalah penelitian yang diterbitkan minggu lalu, memperkenalkan “Starflow,” sebuah sistem yang dikembangkan oleh para peneliti Apple bekerja sama dengan mitra akademik yang menggabungkan aliran normalisasi dengan transformator autoregresif untuk mencapai apa yang oleh tim disebut “kinerja kompetitif” dengan model difusi canggih.
Terobosan datang pada saat kritis bagi Apple, yang telah menghadapi kritik yang meningkat atas perjuangannya dengan kecerdasan buatan. Pada konferensi pengembang di seluruh dunia pada hari Senin, perusahaan meluncurkan hanya pembaruan AI sederhana ke platform Intelijen Apple -nya, menyoroti tekanan kompetitif yang dihadapi perusahaan yang banyak orang terlihat tertinggal dalam perlombaan senjata AI.
“Sepengetahuan kami, pekerjaan ini adalah demonstrasi pertama yang sukses dari aliran normalisasi yang beroperasi secara efektif pada skala dan resolusi ini,” tulis tim peneliti, yang meliputi peneliti pembelajaran mesin Apple Jiatao Gu, Joshua M. Susskind, dan Shuangfei Zhai, bersama dengan kolaborator akademik dari institusi termasuk UC Berkeley dan Georgia Tech.
Bagaimana Apple Melawan Openai dan Google dalam Perang AI
Penelitian StarFlow mewakili upaya Apple yang lebih luas untuk mengembangkan kemampuan AI khas yang dapat membedakan produknya dari pesaing. Sementara perusahaan seperti Google dan Openai telah mendominasi berita utama dengan kemajuan AI generatif mereka, Apple telah mengerjakan pendekatan alternatif yang dapat menawarkan keuntungan unik.
Tim peneliti menangani tantangan mendasar dalam pembuatan gambar AI: meningkatkan aliran normalisasi agar bekerja secara efektif dengan gambar resolusi tinggi. Normalisasi aliran, jenis model generatif yang belajar mengubah distribusi sederhana menjadi yang kompleks, secara tradisional telah dibayangi oleh model difusi dan jaringan permusuhan generatif dalam aplikasi sintesis gambar.
“StarFlow mencapai kinerja kompetitif baik dalam tugas pembuatan gambar-kelas-kondisional dan teks-konten, mendekati model difusi yang canggih dalam kualitas sampel,” tulis para peneliti, menunjukkan fleksibilitas sistem di berbagai jenis tantangan sintesis gambar.
Di dalam terobosan matematika yang memberi kekuatan pada sistem AI baru Apple
Tim peneliti Apple memperkenalkan beberapa inovasi utama untuk mengatasi keterbatasan pendekatan aliran normalisasi yang ada. Sistem ini menggunakan apa yang oleh para peneliti disebut sebagai “desain shallow dalam,” menggunakan “blok transformator yang dalam [that] menangkap sebagian besar model kapasitas representasi, dilengkapi dengan beberapa blok transformator dangkal yang efisien secara komputasi namun secara substansial bermanfaat. ”
Terobosan ini juga melibatkan operasi dalam “ruang laten autoencoder pretrained, yang terbukti lebih efektif daripada pemodelan tingkat piksel langsung,” menurut kertas. Pendekatan ini memungkinkan model untuk bekerja dengan representasi gambar yang terkompresi daripada data piksel mentah, secara signifikan meningkatkan efisiensi.
Tidak seperti model difusi, yang mengandalkan proses denoising iteratif, StarFlow mempertahankan sifat matematika dari aliran normalisasi, memungkinkan “pelatihan kemungkinan maksimum yang tepat dalam ruang kontinu tanpa diskritisasi.”
Apa arti Starflow untuk produk iPhone dan Mac Apple di masa depan
Penelitian ini tiba ketika Apple menghadapi peningkatan tekanan untuk menunjukkan kemajuan yang berarti dalam kecerdasan buatan. Analisis Bloomberg baru -baru ini menyoroti bagaimana Apple Intelligence dan Siri telah berjuang untuk bersaing dengan saingan, sementara pengumuman sederhana Apple di WWDC minggu ini menggarisbawahi tantangan perusahaan di ruang AI.
Untuk Apple, pelatihan kemungkinan telak Starflow dapat menawarkan keuntungan dalam aplikasi yang membutuhkan kontrol yang tepat atas konten yang dihasilkan atau dalam skenario di mana pemahaman ketidakpastian model sangat penting untuk pengambilan keputusan-berpotensi berharga untuk aplikasi perusahaan dan kemampuan AI di atasan yang ditekankan Apple.
Penelitian ini menunjukkan bahwa pendekatan alternatif untuk model difusi dapat mencapai hasil yang sebanding, berpotensi membuka jalan baru untuk inovasi yang dapat bermain dengan kekuatan Apple dalam integrasi perangkat keras-perangkat lunak dan pemrosesan di perangkat.
Mengapa Apple bertaruh pada kemitraan universitas untuk menyelesaikan masalah AI -nya
Penelitian ini mencontohkan strategi Apple dalam berkolaborasi dengan institusi akademik terkemuka untuk memajukan kemampuan AI -nya. Rekan penulis Tianrong Chen, seorang mahasiswa PhD di Georgia Tech yang magang dengan tim peneliti pembelajaran mesin Apple, membawa keahlian dalam kontrol optimal stokastik dan pemodelan generatif.
Kolaborasi ini juga mencakup Ruixiang Zhang dari Departemen Matematika UC Berkeley dan Laurent Dinh, seorang peneliti pembelajaran mesin yang dikenal karena pekerjaan perintis pada model berbasis aliran selama waktunya di Google Brain dan DeepMind.
“Yang terpenting, model kami tetap merupakan aliran normalisasi ujung ke ujung,” para peneliti menekankan, membedakan pendekatan mereka dari metode hibrida yang mengorbankan transtabilitas matematika untuk peningkatan kinerja.
Makalah penelitian lengkap tersedia di ARXIV, memberikan perincian teknis bagi para peneliti dan insinyur yang ingin membangun pekerjaan ini di bidang kompetitif AI generatif. Sementara Starflow mewakili pencapaian teknis yang signifikan, tes sebenarnya adalah apakah Apple dapat menerjemahkan terobosan penelitian seperti itu ke dalam jenis fitur AI yang menghadap konsumen yang telah membuat pesaing seperti nama rumah tangga ChatGPT. Untuk perusahaan yang pernah merevolusi seluruh industri dengan produk -produk seperti iPhone, pertanyaannya bukan apakah Apple dapat berinovasi di AI – apakah mereka dapat melakukannya dengan cukup cepat.