
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Statistik mungkin segalanya dalam bola basket – tetapi untuk Pacers Sports and Entertainment (PS&E), data tentang penggemar sama berharganya.
Namun sementara perusahaan induk dari Indianapolis Pacers (NBA), Indiana Fever (WNBA) dan Indiana Mad Ants (NBA G League) memompa jumlah yang tak terhitung menjadi platform pembelajaran mesin $ 100.000 per tahun (ML) untuk menghasilkan Model prediktif di sekitar faktor -faktor seperti harga dan permintaan tiket, wawasan tidak cukup cepat.
Jared Chavez, manajer rekayasa data dan strategi, berangkat untuk mengubahnya, membuat pindah ke databricks di Salesforce setahun yang lalu.
Sekarang? Timnya melakukan rentang proyek prediktif yang sama dengan konfigurasi komputasi yang cermat untuk mendapatkan wawasan kritis tentang perilaku penggemar – hanya dengan $ 8 per tahun. Ini adalah penurunan kredit chavez yang tak terpikirkan, yang tampaknya tidak terpikirkan sebagian besar pada kemampuan timnya untuk mengurangi komputasi ML ke jumlah yang hampir tak terbatas.
“Kami sangat pandai mengoptimalkan komputasi kami dan mencari tahu dengan tepat seberapa jauh kami dapat menekan batas untuk menjalankan model kami,” katanya kepada VentureBeat. “Itulah yang kami kenal dengan databricks.”
Memotong Opex sebesar 98%
Selain tiga tim bola basketnya, PS&E PS&E yang berbasis di Indianapolis mengoperasikan bisnis Esports Pacers Gaming, menjadi tuan rumah March Madness Games dan menjalankan bisnis acara yang sibuk 300-plus Day melalui Gainbridge Fieldhouse Arena (konser, pertunjukan komedi, rodeo, olahraga lainnya acara). Selanjutnya, perusahaan baru bulan lalu mengumumkan rencana untuk membangun pusat kinerja olahraga Indiana Fever senilai $ 78 juta, yang akan dihubungkan oleh Skybridge ke arena dan garasi parkir (diperkirakan akan dibuka pada tahun 2027).
Semua ini membuat dalam jumlah data yang membingungkan-dan data sprawl. Dari sudut pandang infrastruktur data, Chavez menunjukkan bahwa, hingga dua tahun yang lalu, organisasi ini menjadi tuan rumah dua gudang yang sepenuhnya independen yang dibangun di Microsoft Azure Synapse Analytics. Tim yang berbeda di seluruh bisnis semua menggunakan bentuk analitik mereka sendiri, dan perangkat dan keahlian bervariasi secara liar.
Sementara Azure Synapse melakukan pekerjaan besar yang menghubungkan ke platform eksternal, itu mahal untuk organisasi ukuran PS&E, jelasnya. Juga, mengintegrasikan platform ML perusahaan dengan Microsoft Azure Data Studio menyebabkan fragmentasi.
Untuk mengatasi masalah ini, Chavez beralih ke Databricks Automl dan ruang kerja Machine Learning DataBricks pada Agustus 2023. Fokus awalnya adalah untuk mengkonfigurasi, melatih, dan menggunakan model di sekitar harga tiket dan permintaan permainan.
Baik pengguna teknis dan non-teknis segera menemukan platform bermanfaat, kata Chavez, dan mereka dengan cepat mempercepat proses ML (dan anjlok biaya).
“Ini secara dramatis meningkatkan waktu respons untuk tim pemasaran saya, karena mereka tidak harus tahu bagaimana membuat kode,” kata Chavez. Ini semua tombol untuk mereka, dan semua data itu kembali ke databricks sebagai catatan terpadu. “
Lebih lanjut, timnya mengorganisir sistem 60-beberapa-aneh perusahaan ke dalam Salesforce Data Cloud. Sekarang, ia melaporkan bahwa mereka memiliki 440x lebih banyak data dalam penyimpanan dan 8x lebih banyak sumber data dalam produksi.
PS&E hari ini beroperasi hanya di bawah 2% dari biaya OPEX tahunan sebelumnya. “Kami menyelamatkan ratusan ribu per tahun hanya dalam operasi,” kata Chavez. “Kami menginvestasikannya kembali ke pengayaan data pelanggan. Kami menginvestasikan kembali ke alat yang lebih baik untuk tidak hanya tim saya, tetapi unit analitik di sekitar perusahaan. ”
Penyempurnaan yang berkelanjutan, pemahaman data yang mendalam
Bagaimana timnya bisa dihitung begitu rendah? DataBricks telah menyempurnakan konfigurasi cluster, opsi konektivitas yang ditingkatkan untuk skema dan output model terintegrasi kembali ke tabel data PS&E, Chavez menjelaskan. Mesin ML yang kuat adalah “terus memperkaya, memperbaiki, menggabungkan dan memprediksi” pada catatan pelanggan PS&E di setiap sistem dan aliran pendapatan.
Hal ini mengarah pada prediksi yang lebih baik dengan setiap iterasi-dan pada kenyataannya, model Automl sesekali kadang-kadang membuatnya langsung ke produksi tanpa ada lagi tweaking dari timnya, Chavez melaporkan.
“Sejujurnya, itu hanya mengetahui ukuran data yang masuk, tetapi juga kira -kira berapa lama waktu yang dibutuhkan untuk berlatih,” kata Chavez. Dia menambahkan: “Ini pada ukuran cluster terkecil yang mungkin Anda jalankan, itu mungkin hanya cluster yang dioptimalkan memori, tetapi hanya mengetahui Apache Spark dengan cukup baik dan mengetahui ke arah mana kami dapat menyimpan dan membaca data dengan cukup optimal.”
Siapa yang paling mungkin membeli tiket musim?
Satu cara tim Chavez menggunakan data, AI dan ML berada dalam penilaian kecenderungan untuk paket tiket musiman. Seperti yang dia katakan: “Kami menjual jumlah yang tidak saleh dari mereka.”
Tujuannya adalah untuk menentukan karakteristik pelanggan mana yang mempengaruhi tempat mereka memilih untuk duduk. Chavez menjelaskan bahwa timnya adalah alamat geo-locating yang mereka miliki di file untuk membuat korelasi antara demografi, tingkat pendapatan dan jarak perjalanan. Mereka juga menganalisis sejarah pembelian pengguna di seluruh ritel, makanan dan minuman, keterlibatan aplikasi seluler dan acara lain yang mungkin mereka hadiri di kampus PS&E.
Lebih lanjut, mereka menarik data dari StubHub, Seat Geek dan vendor lain di luar Ticketmaster untuk mengevaluasi titik harga dan menentukan seberapa baik inventaris bergerak. Ini semua bisa menikah dengan semua yang mereka ketahui tentang pelanggan tertentu untuk mencari tahu di mana mereka akan duduk, Chavez menjelaskan.
Berbekal data itu, mereka kemudian dapat, misalnya, meningkatkan pelanggan yang diberikan dari bagian 201 ke Pengadilan Pusat Bagian 101. “Sekarang kami tidak hanya dapat menjual kembali kursinya di dek yang lebih tinggi, kami juga dapat menjual paket lain yang lebih kecil di kursi yang sama yang ia beli di pertengahan musim, menggunakan karakteristik yang sama untuk orang lain,” kata Chavez.
Demikian pula, data dapat digunakan untuk meningkatkan sponsor, yang sangat penting untuk setiap waralaba olahraga.
“Tentu saja, mereka ingin menyelaraskan dengan organisasi yang tumpang tindih dengan mereka,” kata Chavez. “Jadi bisakah kita memperkaya lebih baik? Bisakah kita memprediksi dengan lebih baik? Bisakah kita melakukan segmentasi khusus? ”
Idealnya, tujuannya adalah antarmuka di mana setiap pengguna dapat mengajukan pertanyaan seperti: 'Beri saya bagian dari basis penggemar Pacers di usia pertengahan hingga akhir 20-an dengan pendapatan sekali pakai.' Melangkah lebih jauh: 'Cari mereka yang menghasilkan lebih dari $ 100 ribu setahun dan memiliki minat pada kendaraan mewah.' Antarmuka kemudian dapat mengembalikan persentase yang tumpang tindih dengan data sponsor.
“Ketika tim kemitraan kami mencoba untuk menutup kesepakatan ini, mereka dapat, sesuai permintaan, hanya menarik informasi tanpa harus bergantung pada tim analitik untuk melakukannya untuk mereka,” kata Chavez.
Untuk lebih mendukung tujuan ini, timnya ingin membangun ruang bersih data, atau lingkungan yang aman yang memungkinkan berbagi data sensitif. Ini dapat sangat membantu dengan sponsor, serta kolaborasi dengan tim lain dan NCAA (yang berkantor pusat di Indianapolis).
“Nama permainan untuk kami saat ini adalah waktu respons, apakah itu pelanggan yang menghadap atau internal,” kata Chavez. “Bisakah kita secara dramatis mengurangi pengetahuan yang diperlukan untuk memotong informasi dan mengurutkannya menggunakan AI?”
Pengumpulan data dan AI untuk memahami pola lalu lintas, meningkatkan signage
Area fokus lain untuk tim Chavez adalah memeriksa di mana orang-orang berada pada waktu tertentu di seluruh kampus PS&E (yang terdiri dari arena tiga tingkat dengan plaza luar ruangan). Chavez menjelaskan bahwa kemampuan penangkapan data ada di seluruh infrastruktur jaringannya melalui titik akses WiFi.
“Ketika Anda berjalan ke arena, Anda sedang melakukan ping dari semuanya, bahkan jika Anda tidak masuk ke dalamnya, karena ponsel Anda memeriksa WiFi,” katanya. “Saya bisa melihat ke mana Anda pindah. Saya tidak tahu siapa Anda, tetapi saya bisa melihat ke mana Anda pindah. ”
Ini pada akhirnya dapat membantu membimbing orang -orang di sekitar arena – katakanlah, jika seseorang ingin membeli pretzel dan sedang mencari dudukan konsesi – dan membantu timnya menentukan di mana memposisikan makanan dan kios barang dagangan.
Demikian pula, data lokasi dapat membantu menentukan tempat optimal untuk papan nama, Chavez menjelaskan. Salah satu cara yang menarik untuk mengidentifikasi jumlah tayangan signage adalah menempatkan gradien penglihatan di tempat yang setara dengan tinggi kipas rata -rata.
“Kalau begitu mari kita menghitung seberapa baik seseorang akan melihat ini berjalan dengan jumlah orang di sekitar mereka,” kata Chavez. “Jadi saya bisa memberi tahu sponsor saya bahwa Anda mendapat 5.000 tayangan tentang ini, dan 1.200 di antaranya cukup bagus.”
Demikian pula, ketika penggemar berada di kursi mereka, mereka dikelilingi oleh tanda -tanda dan tampilan digital. Data lokasi dapat membantu menentukan kualitas (dan jumlah) tayangan berdasarkan sudut tempat mereka duduk. Seperti yang dicatat Chavez: “Jika iklan ini hanya ada di layar selama 10 detik di kuartal ketiga, siapa yang akan melihatnya?”
Setelah PS&E memiliki data lokasi yang memadai untuk membantu menjawab pertanyaan -pertanyaan ini, timnya berencana untuk bekerja dengan lab VR Universitas Indiana untuk memodelkan seluruh kampus. “Kalau begitu kita hanya akan memiliki kotak pasir yang sangat menyenangkan untuk dikelilingi dan menjawab semua pertanyaan ruang 3D ini yang telah menggangguku selama dua tahun terakhir,” kata Chavez.