
Ini adalah artikel VB Lab Insights yang disajikan oleh Capital One.
AI menawarkan potensi transformatif, tetapi membuka kunci nilainya membutuhkan manajemen data yang kuat. AI membangun di atas fondasi data yang solid yang dapat meningkatkan secara iteratif, menciptakan efek roda gila antara data dan AI. Roda gila ini memungkinkan perusahaan untuk membangun lebih banyak solusi real-time yang membuka dampak bagi pelanggan dan bisnis mereka.
Mengelola data di dunia saat ini bukan tanpa kompleksitas. Volume data meroket, dengan penelitian menunjukkan itu dua kali lipat dalam lima tahun terakhir saja. Akibatnya, 68% data yang tersedia untuk perusahaan dibiarkan belum dimanfaatkan. Di dalam data itu, ada berbagai macam struktur dan format, dengan MIT mencatat bahwa sekitar 80-90% data tidak terstruktur-memicu kompleksitas dalam menggunakannya. Dan akhirnya, kecepatan di mana data perlu digunakan untuk pengguna semakin cepat. Beberapa kasus penggunaan membutuhkan ketersediaan data sub-10 milidetik, atau dengan kata lain, sepuluh kali lebih cepat dari sekejap mata.
Ekosistem data saat ini adalah besar, beragam dan cepat – dan revolusi AI semakin meningkatkan taruhan tentang bagaimana perusahaan mengelola dan menggunakan data.
Fundamental untuk Data Hebat
Siklus hidup data rumit dan tak kenal ampun, sering melibatkan banyak langkah, banyak lompatan dan banyak alat. Hal ini dapat menyebabkan cara -cara yang berbeda dalam bekerja dengan data dan berbagai tingkat kematangan dan instrumentasi untuk mendorong manajemen data.
Untuk memberdayakan pengguna dengan data yang dapat dipercaya untuk inovasi, kita harus terlebih dahulu menangani dasar-dasar mengelola data yang hebat: swalayan, otomatisasi, dan skala.
- Layanan mandiri berarti memberdayakan pengguna untuk melakukan pekerjaan mereka dengan gesekan minimal. Ini mencakup area seperti penemuan data yang mulus, kemudahan produksi data dan alat yang mendemokratisasi akses data.
- Otomasi memastikan bahwa semua kemampuan manajemen data inti tertanam dalam alat dan pengalaman yang memungkinkan pengguna untuk bekerja dengan data.
- Ekosistem data perlu skala – terutama di era AI. Di antara pertimbangan lain, perusahaan perlu mempertimbangkan skalabilitas teknologi tertentu, kemampuan ketahanan dan perjanjian tingkat layanan yang menetapkan kewajiban dasar untuk bagaimana data harus dikelola (serta mekanisme penegakan hukum untuk perjanjian tersebut).
Prinsip -prinsip ini meletakkan dasar untuk memproduksi dan mengonsumsi data yang bagus.
Menghasilkan data yang bagus
Produsen data bertanggung jawab atas data onboarding dan mengatur data, memungkinkan konsumsi yang cepat dan efisien. Portal swalayan yang dirancang dengan baik dapat memainkan peran kunci di sini dengan memungkinkan produsen untuk berinteraksi dengan sistem yang mulus dengan sistem di seluruh ekosistem-seperti penyimpanan, kontrol akses, persetujuan, versi dan katalog bisnis. Tujuannya adalah untuk membuat bidang kontrol terpadu yang mengurangi kompleksitas sistem ini, membuat data tersedia dalam format yang tepat, pada waktu yang tepat dan di tempat yang tepat.
Untuk skala dan menegakkan tata kelola, perusahaan dapat memilih antara platform pusat dan model federasi – atau bahkan mengadopsi pendekatan hibrida. Platform pusat menyederhanakan aturan penerbitan data dan tata kelola, sementara model federasi menawarkan fleksibilitas, menggunakan SDK yang dibangun khusus untuk mengelola tata kelola dan infrastruktur secara lokal. Kuncinya adalah menerapkan mekanisme yang konsisten yang memastikan otomatisasi dan skalabilitas, memungkinkan bisnis untuk secara andal menghasilkan data berkualitas tinggi yang memicu inovasi AI.
Mengkonsumsi data hebat
Konsumen data-seperti ilmuwan data dan insinyur data-membutuhkan akses mudah ke data yang andal dan berkualitas tinggi untuk eksperimen dan pengembangan yang cepat. Menyederhanakan strategi penyimpanan adalah langkah dasar. Dengan memusatkan komputasi di dalam danau data dan menggunakan lapisan penyimpanan tunggal, perusahaan dapat meminimalkan sprawl data dan mengurangi kompleksitas dengan memungkinkan mesin komputasi untuk mengkonsumsi data dari lapisan penyimpanan tunggal.
Perusahaan juga harus mengadopsi strategi zona untuk menangani beragam kasus penggunaan. Misalnya, zona mentah dapat mendukung data yang diperluas dan jenis file seperti data yang tidak terstruktur, sementara zona yang dikuratori menegakkan skema yang lebih ketat dan persyaratan kualitas. Pengaturan ini memungkinkan fleksibilitas sambil mempertahankan tata kelola dan kualitas data. Konsumen dapat menggunakan zona ini untuk kegiatan seperti menciptakan ruang pribadi untuk eksperimen atau zona kolaboratif untuk proyek tim.
Layanan otomatis memastikan akses data, manajemen siklus hidup dan kepatuhan, memberdayakan pengguna untuk berinovasi dengan kepercayaan dan kecepatan.
Memimpin dengan kesederhanaan
Strategi AI yang efektif didasarkan pada ekosistem data yang kuat dan dirancang dengan baik. Dengan menyederhanakan bagaimana Anda memproduksi dan mengonsumsi data-dan meningkatkan kualitas data tersebut-bisnis dapat memberdayakan pengguna untuk berinovasi di bidang mengemudi kinerja baru dengan percaya diri.
Sebagai dasar, sangat penting bahwa bisnis memprioritaskan ekosistem dan proses yang meningkatkan kepercayaan dan aksesibilitas. Dengan menerapkan prinsip-prinsip yang diuraikan di atas, mereka dapat melakukan hal itu-membangun manajemen data yang dapat diskalakan dan dapat ditegakkan yang akan memberi daya pada eksperimen cepat dalam AI dan pada akhirnya memberikan nilai bisnis jangka panjang.
Marty Andolino adalah VP, rekayasa perangkat lunak di Capital One
Kajal Wood adalah Direktur Sr., Rekayasa Perangkat Lunak di Capital One
Konten VB Lab Insights dibuat bekerja sama dengan perusahaan yang membayar untuk pos atau memiliki hubungan bisnis dengan VentureBeat, dan mereka selalu ditandai dengan jelas. Untuk informasi lebih lanjut, hubungi