
Bergabunglah dengan acara yang dipercaya oleh para pemimpin perusahaan selama hampir dua dekade. VB Transform menyatukan orang -orang yang membangun strategi AI perusahaan nyata. Pelajari lebih lanjut
Catatan Editor: Kumo AI adalah salah satu finalis di VB Transform selama showcase inovasi tahunan kami dan menyajikan RFM dari Mainstage di VB Transform pada hari Rabu.
Boom AI generatif telah memberi kita model bahasa yang kuat yang dapat menulis, meringkas dan beralasan atas sejumlah besar teks dan jenis data lainnya. Tetapi ketika datang ke tugas-tugas prediktif bernilai tinggi seperti memprediksi churn pelanggan atau mendeteksi penipuan dari data yang terstruktur dan relasional, perusahaan tetap macet di dunia pembelajaran mesin tradisional.
Profesor Stanford dan salah satu pendiri Kumo AI Jure Leskovec berpendapat bahwa ini adalah bagian yang hilang kritis. Alat perusahaannya, Model Foundation Relational (RFM), adalah jenis baru AI terlatih yang membawa kemampuan “zero-shot” dari model bahasa besar (LLM) ke database terstruktur.
“Ini tentang membuat ramalan tentang sesuatu yang belum Anda ketahui, sesuatu yang belum terjadi,” kata Leskovec kepada VentureBeat. “Dan itu adalah kemampuan yang secara fundamental baru, yaitu, saya berpendapat, hilang dari lingkup saat ini tentang apa yang kita anggap sebagai Jenderal AI.”
Mengapa ML prediktif adalah “teknologi berusia 30 tahun”
Sementara sistem LLMS dan Retrieval-Augmented Generation (RAG) dapat menjawab pertanyaan tentang pengetahuan yang ada, mereka pada dasarnya retrospektif. Mereka mengambil dan alasan atas informasi yang sudah ada di sana. Untuk tugas bisnis prediktif, perusahaan masih mengandalkan pembelajaran mesin klasik.
Misalnya, untuk membangun model yang memprediksi churn pelanggan, bisnis harus mempekerjakan tim ilmuwan data yang menghabiskan waktu yang sangat lama melakukan “rekayasa fitur,” proses membuat sinyal prediktif secara manual dari data. Ini melibatkan perselisihan data yang kompleks untuk bergabung dengan informasi dari tabel yang berbeda, seperti riwayat pembelian pelanggan dan klik situs web, untuk membuat tabel pelatihan tunggal yang besar.
“Jika Anda ingin melakukan pembelajaran mesin (ML), maaf, Anda terjebak di masa lalu,” kata Leskovec. Kemacetan yang mahal dan memakan waktu mencegah sebagian besar organisasi benar-benar gesit dengan data mereka.
Bagaimana Kumo menggeneralisasi transformator untuk database
Pendekatan Kumo, “Pembelajaran Depi Relasional,” menghindari proses manual ini dengan dua wawasan utama. Pertama, secara otomatis mewakili database relasional sebagai grafik tunggal yang saling berhubungan. Misalnya, jika database memiliki tabel “pengguna” untuk merekam informasi pelanggan dan tabel “pesanan” untuk merekam pembelian pelanggan, setiap baris dalam tabel pengguna menjadi simpul pengguna, setiap baris dalam tabel pesanan menjadi simpul pesanan, dan sebagainya. Node ini kemudian secara otomatis terhubung menggunakan hubungan database yang ada, seperti kunci asing, membuat peta yang kaya dari seluruh dataset tanpa upaya manual.
Kedua, Kumo menggeneralisasi arsitektur transformator, mesin di belakang LLMS, untuk belajar langsung dari representasi grafik ini. Transformers unggul dalam memahami urutan token dengan menggunakan “mekanisme perhatian” untuk menimbang pentingnya token yang berbeda dalam kaitannya satu sama lain.
RFM Kumo menerapkan mekanisme perhatian yang sama ini pada grafik, memungkinkannya untuk mempelajari pola dan hubungan yang kompleks di berbagai tabel secara bersamaan. Leskovec membandingkan lompatan ini dengan evolusi visi komputer. Pada awal 2000 -an, insinyur ML harus merancang fitur secara manual seperti tepi dan bentuk untuk mendeteksi suatu objek. Tetapi arsitektur yang lebih baru seperti Convolutional Neural Networks (CNN) dapat menggunakan piksel mentah dan secara otomatis mempelajari fitur yang relevan.
Demikian pula, RFM menelan tabel basis data mentah dan memungkinkan jaringan menemukan sinyal paling prediktif sendiri tanpa perlu upaya manual.
Hasilnya adalah model fondasi pra-terlatih yang dapat melakukan tugas prediktif pada database baru secara instan, apa yang dikenal sebagai “zero-shot.” Selama demo, Leskovec menunjukkan bagaimana pengguna dapat mengetikkan kueri sederhana untuk memprediksi apakah pelanggan tertentu akan melakukan pemesanan dalam 30 hari ke depan. Dalam hitungan detik, sistem mengembalikan skor probabilitas dan penjelasan titik data yang mengarah pada kesimpulannya, seperti aktivitas pengguna baru -baru ini atau ketiadaannya. Model ini tidak dilatih pada database yang disediakan dan diadaptasi dengannya secara real time melalui pembelajaran dalam konteks.

“Kami memiliki model pra-terlatih yang cukup menunjuk Anda ke data Anda, dan itu akan memberi Anda prediksi yang akurat 200 milidetik kemudian,” kata Leskovec. Dia menambahkan bahwa itu bisa “seakurat, katakanlah, berminggu -minggu pekerjaan ilmuwan data.”
Antarmuka dirancang untuk menjadi akrab bagi analis data, bukan hanya spesialis pembelajaran mesin, mendemokratisasi akses ke analitik prediktif.
Menggerakkan masa depan agen
Teknologi ini memiliki implikasi yang signifikan untuk pengembangan agen AI. Agar agen melakukan tugas yang bermakna dalam suatu perusahaan, ia perlu melakukan lebih dari sekadar proses proses; Itu harus membuat keputusan cerdas berdasarkan data pribadi perusahaan. RFM dapat berfungsi sebagai mesin prediktif untuk agen -agen ini. Misalnya, agen layanan pelanggan dapat meminta RFM untuk menentukan kemungkinan pelanggan untuk mengaduk atau nilai potensial masa depan mereka, kemudian menggunakan LLM untuk menyesuaikan percakapannya dan menawarkannya.
“Jika kami percaya pada masa depan agen, agen perlu membuat keputusan yang berakar pada data pribadi. Dan ini adalah cara bagi agen untuk membuat keputusan,” Leskovec menjelaskan.
Pekerjaan Kumo menunjuk ke masa depan di mana perusahaan AI dibagi menjadi dua domain pelengkap: LLM untuk menangani pengetahuan retrospektif dalam teks yang tidak terstruktur, dan RFM untuk peramalan prediktif pada data terstruktur. Dengan menghilangkan kemacetan rekayasa fitur, RFM berjanji untuk menempatkan alat ML yang kuat ke tangan lebih banyak perusahaan, secara drastis mengurangi waktu dan biaya untuk mendapatkan dari data ke keputusan.
Perusahaan telah merilis demo publik RFM dan berencana untuk meluncurkan versi yang memungkinkan pengguna untuk menghubungkan data mereka sendiri dalam beberapa minggu mendatang. Untuk organisasi yang membutuhkan akurasi maksimal, Kumo juga akan menawarkan layanan penyempurnaan untuk meningkatkan kinerja lebih lanjut pada set data pribadi.