
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Google Cloud mengumumkan a sejumlah besar fitur baru Pada acara Google Cloud Next minggu lalu, dengan setidaknya 229 pengumuman baru.
Dimakamkan di gunung berita itu, yang termasuk keripik AI baru dan kemampuan AI agen, serta pembaruan basis dataES, Google Cloud juga melakukan beberapa langkah besar dengan layanan gudang data BigQuery -nya. Di antara kemampuan baru adalah BigQuery Unified Governance, yang membantu organisasi menemukan, memahami dan mempercayai aset data mereka. Alat tata kelola membantu mengatasi hambatan utama untuk adopsi AI dengan memastikan kualitas data, aksesibilitas, dan kepercayaan.
Taruhannya sangat besar untuk Google karena mengambil saingan di ruang data perusahaan.
BigQuery telah ada di pasaran sejak 2011 dan telah tumbuh secara signifikan dalam beberapa tahun terakhir, baik dalam hal kemampuan maupun basis pengguna. Rupanya, BigQuery juga merupakan bisnis besar untuk Google Cloud. Selama Google Cloud berikutnya, itu terungkap untuk pertama kalinya seberapa besar bisnis sebenarnya. Menurut Google, BigQuery memiliki lima kali lipat jumlah pelanggan dari Snowflake dan databricks.
“Ini adalah tahun pertama kami telah diberi izin untuk benar -benar memposting stat pelanggan, yang menyenangkan bagi saya,” Yasmeen Ahmad, direktur pelaksana analisis data di Google Cloud, mengatakan kepada VentureBeat. “Databricks dan Snowflake, mereka adalah satu -satunya jenis lain dari platform gudang data perusahaan di pasar. Kami memiliki lima kali lebih banyak pelanggan daripada keduanya.”
Bagaimana Google meningkatkan BigQuery untuk memajukan adopsi perusahaan
Sementara Google sekarang mengklaim memiliki basis pengguna yang lebih luas daripada saingannya, ia juga tidak melepas kaki dari gas. Dalam beberapa bulan terakhir, dan khususnya di Google Cloud Next, Hyperscaler telah mengumumkan beberapa kemampuan baru untuk memajukan adopsi perusahaan.
Tantangan utama untuk perusahaan AI adalah memiliki akses ke data yang benar yang memenuhi perjanjian tingkat layanan bisnis (SLA). Menurut Gartner Research yang dikutip oleh Google, organisasi yang tidak mengaktifkan dan mendukung kasus penggunaan AI mereka melalui praktik data yang siap-AI akan melihat lebih dari 60% proyek AI gagal memenuhi SLA bisnis dan ditinggalkan.
Tantangan ini berasal dari tiga masalah persisten yang mengganggu manajemen data perusahaan:
- Silo data yang terfragmentasi
- Persyaratan yang berubah dengan cepat
- Budaya data organisasi yang tidak konsisten di mana tim tidak berbagi bahasa umum di sekitar data.
Solusi Tata Kelola Terpadu Google Google merupakan keberangkatan yang signifikan dari pendekatan tradisional dengan menanamkan kemampuan tata kelola secara langsung dalam platform BigQuery daripada membutuhkan alat atau proses terpisah.
BigQuery Unified Governance: penyelaman teknis mendalam
Inti dari pengumuman Google adalah BigQuery Unified Governance, didukung oleh katalog Universal BigQuery yang baru. Tidak seperti katalog tradisional yang hanya berisi informasi tabel dan kolom dasar, katalog universal mengintegrasikan tiga jenis metadata yang berbeda:
- Metadata fisik/teknis: Definisi skema, tipe data dan statistik profil.
- Metadata bisnis: Istilah glosarium bisnis, deskripsi dan konteks semantik.
- Metadata runtime: Pola kueri, statistik penggunaan dan informasi format khusus untuk teknologi seperti Apache Iceberg.
Pendekatan terpadu ini memungkinkan BigQuery untuk mempertahankan pemahaman yang komprehensif tentang aset data di seluruh perusahaan. Apa yang membuat sistem ini sangat kuat adalah bagaimana Google telah mengintegrasikan Gemini, model AI canggihnya, langsung ke lapisan tata kelola melalui apa yang mereka sebut mesin pengetahuan.
Mesin pengetahuan secara aktif meningkatkan tata kelola dengan menemukan hubungan antara dataset, memperkaya metadata dengan konteks bisnis dan memantau kualitas data secara otomatis.
Kemampuan utama meliputi pencarian semantik dengan pemahaman bahasa alami, generasi metadata otomatis, penemuan hubungan bertenaga AI, produk data untuk pengemasan aset terkait, glosarium bisnis, katalog otomatis dari data terstruktur dan tidak terstruktur dan deteksi anomali otomatis.
Lupakan tolok ukur, perusahaan AI adalah masalah yang lebih besar
Strategi Google melampaui kompetisi model AI.
“Saya pikir ada terlalu banyak industri yang hanya berfokus untuk mendapatkan papan peringkat individu itu, dan sebenarnya Google berpikir secara holistik tentang masalahnya,” kata Ahmad.
Pendekatan komprehensif ini membahas seluruh siklus hidup data perusahaan, menjawab pertanyaan kritis seperti: Bagaimana Anda memenuhi kepercayaan? Bagaimana Anda memberikan skala? Bagaimana Anda memenuhi tata kelola dan keamanan?
Dengan berinovasi di setiap lapisan tumpukan dan menyatukan inovasi-inovasi ini, Google telah menciptakan apa yang Ahmad sebut sebagai roda gila aktivasi data real-time, di mana, segera setelah data ditangkap, terlepas dari jenis atau format atau di mana ia disimpan, ada generasi metadata instan, garis keturunan dan kualitas.
Yang mengatakan, model memang penting. Ahmad menjelaskan bahwa dengan munculnya model berpikir seperti Gemini 2.0, telah ada pembukaan besar untuk platform data Google.
“Setahun yang lalu, ketika Anda meminta Genai untuk menjawab pertanyaan bisnis, apa pun yang menjadi sedikit lebih kompleks, Anda benar -benar perlu memecahnya menjadi beberapa langkah,” katanya. “Tiba -tiba, dengan model berpikir itu bisa muncul dengan rencana … Anda tidak harus membuat kode cara untuk membangun rencana. Ia tahu bagaimana membangun rencana.”
Akibatnya, dia mengatakan bahwa sekarang Anda dapat dengan mudah memiliki agen rekayasa data membangun pipa yang tiga langkah atau 10 langkah. Integrasi dengan kemampuan AI Google telah mengubah apa yang mungkin dengan data perusahaan.
Dampak dunia nyata: Bagaimana perusahaan menguntungkan
Levi Strauss & Company menawarkan contoh menarik tentang bagaimana tata kelola data terpadu dapat mengubah operasi bisnis. Perusahaan berusia 172 tahun ini menggunakan kemampuan tata kelola data Google karena bergeser dari menjadi bisnis grosir menjadi merek langsung-ke-konsumen. Dalam sesi di Google Cloud Next, Vinay Narayana, yang menjalankan data dan rekayasa platform AI di Levi's, merinci kasus penggunaan organisasinya.
“Kami bercita-cita untuk memberdayakan analis bisnis kami untuk memiliki akses ke data real-time yang juga akurat,” kata Narayana. “Sebelum kami memulai perjalanan kami untuk membangun platform baru, kami menemukan berbagai tantangan pengguna. Pengguna bisnis kami tidak tahu di mana data tinggal, dan jika mereka tahu sumber data, mereka tidak tahu siapa yang memilikinya. Jika mereka entah bagaimana mendapatkan akses, tidak ada dokumentasi.”
Levi membangun platform data di Google Cloud yang mengatur produk data berdasarkan domain bisnis, membuatnya dapat ditemukan melalui Hub Analytics (Google's Data Marketplace). Setiap produk data disertai dengan dokumentasi terperinci, informasi garis keturunan dan metrik kualitas.
Hasilnya sangat mengesankan: “Kami 50x lebih cepat dari platform data warisan kami, dan ini berada di ujung bawah. Sejumlah besar visualisasi adalah 100x lebih cepat,” kata Narayana. “Kami memiliki lebih dari 700 pengguna yang sudah menggunakan platform setiap hari.”
Contoh lain berasal dari Verizon, yang menggunakan alat tata kelola Google sebagai bagian dari satu inisiatif data Verizon untuk menyatukan data yang sebelumnya dibungkam di seluruh unit bisnis.
“Ini akan menjadi gudang data telekomunikasi terbesar di Amerika Utara yang berjalan di BigQuery,” Arvind Rajagopalan, AVP rekayasa data, arsitektur, dan produk di Verizon, mengatakan selama sesi Google Cloud berikutnya.
Estate data perusahaan sangat besar, terdiri dari 3.500 pengguna yang menjalankan sekitar 50 juta pertanyaan, 35.000 jaringan pipa data, dan lebih dari 40 petabyte data.
Dalam sesi sorotan di Google Cloud Next, Ahmad juga memberikan banyak contoh pengguna lainnya. Radisson Hotel Group mempersonalisasi iklan mereka dalam skala, melatih model Gemini pada data BigQuery. Tim mengalami peningkatan produktivitas 50%, sementara pendapatan dari kampanye bertenaga AI naik lebih dari 20%. Gordon Food Service bermigrasi ke BigQuery, memastikan data mereka siap untuk AI dan meningkatkan adopsi aplikasi yang menghadap pelanggan sebesar 96%
Apa perbedaan 'besar': Menjelajahi lanskap kompetitif
Ada beberapa vendor di ruang gudang data perusahaan, termasuk databrick, kepingan salju, Microsoft dengan Synapse dan Amazon dengan pergeseran merah. Semua vendor ini telah mengembangkan berbagai bentuk integrasi AI dalam beberapa tahun terakhir.
Databricks memiliki a Platform Data Lakehouse Komprehensif dan telah berkembang Kemampuan AI sendiri, sebagian berkat akuisisi Mosaic senilai $ 1,3 miliar. Amazon Redshift menambahkan dukungan untuk AI generatif pada tahun 2023, dengan Amazon Q Membantu pengguna membangun pertanyaan dan mendapatkan jawaban yang lebih baik. Untuk bagiannya, Snowflake telah sibuk mengembangkan alat dan bermitra dengan Model Bahasa Besar (LLM) penyedia, termasuk antropik.
Ketika ditekan pada perbandingan khusus dengan penawaran Microsoft, Ahmad berpendapat bahwa Synapse bukan platform data perusahaan untuk jenis kasus penggunaan yang digunakan pelanggan untuk BigQuery.
“Saya pikir kami telah melompati seluruh industri, karena kami telah mengerjakan semua bagian,” katanya. “Ngomong -ngomong, kami memiliki model terbaik, ini adalah model terbaik yang terintegrasi dalam tumpukan data yang memahami bagaimana agen bekerja.”
Integrasi ini telah mendorong adopsi cepat kemampuan AI dalam BigQuery. Menurut Google, penggunaan pelanggan model AI Google di BigQuery untuk analisis multimodal telah meningkat 16 kali dari tahun ke tahun.
Apa artinya ini bagi perusahaan yang mengadopsi AI
Untuk perusahaan yang sudah berjuang dengan implementasi AI, pendekatan terintegrasi Google terhadap tata kelola dapat menawarkan jalur yang lebih ramping menuju keberhasilan daripada menyatukan manajemen data yang terpisah dan sistem AI.
Klaim Ahmad bahwa Google telah “melompat” pesaing di ruang ini akan menghadapi pengawasan ketika organisasi menempatkan kemampuan baru ini untuk bekerja. Namun, contoh pelanggan dan detail teknis menunjukkan Google telah membuat kemajuan yang signifikan dalam menangani salah satu aspek paling menantang dari adopsi AI perusahaan.
Untuk pembuat keputusan teknis yang mengevaluasi platform data, pertanyaan utama adalah apakah pendekatan terintegrasi ini memberikan nilai tambahan yang cukup untuk membenarkan migrasi dari investasi yang ada di platform khusus, seperti kepingan salju atau databricks, dan apakah Google dapat mempertahankan kecepatan inovasi saat ini ketika pesaing merespons.