
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Agen AI adalah semua kemarahan, tetapi bagaimana dengan yang difokuskan secara khusus pada menganalisis, menyortir dan menggambar kesimpulan dari volume data yang luas?
Agen Ilmu Data Google melakukan hal itu: Asisten AI Gemini 2.0 yang baru dan gratis yang mengotomatiskan analisis data sekarang tersedia untuk pengguna berusia 18-plus di negara dan bahasa tertentu secara gratis.
Asisten ini tersedia melalui Google Colab, layanan perusahaan berusia delapan tahun untuk menjalankan Python Code Live Online di atas unit pemrosesan grafis (GPU) yang dimiliki oleh raksasa pencarian dan unit pemrosesan tensor in-house (TPU) sendiri.
Awalnya diluncurkan untuk penguji tepercaya pada bulan Desember 2024, Agen Ilmu Data dirancang untuk membantu para peneliti, ilmuwan data dan pengembang merampingkan alur kerja mereka dengan menghasilkan buku catatan Jupyter yang berfungsi penuh dari deskripsi bahasa alami, semuanya di browser pengguna.
Ekspansi ini selaras dengan upaya berkelanjutan Google untuk mengintegrasikan fitur pengkodean dan ilmu data yang digerakkan AI ke dalam Colab, membangun pembaruan sebelumnya seperti bantuan pengkodean AI bertenaga Codey, yang diumumkan pada Mei 2023.
Ini juga bertindak sebagai semacam jawaban canggih dan terlambat untuk Analisis Data Lanjutan ChatGPT Openai (sebelumnya Code Interpreter), yang sekarang dibangun ke dalam chatgpt saat menjalankan GPT-4.
Apa itu Google Colab?
Google Colab (Singkat untuk Colaboratory) adalah lingkungan notebook Jupyter berbasis cloud yang memungkinkan pengguna untuk menulis dan menjalankan kode Python secara langsung di browser mereka.
Jupyter Notebook adalah aplikasi web open-source yang memungkinkan pengguna untuk membuat dan berbagi dokumen yang berisi kode langsung, persamaan, visualisasi, dan teks naratif. Berasal dari Proyek Ipython pada tahun 2014, sekarang mendukung lebih dari 40 bahasa pemrograman, termasuk Python, R dan Julia. Platform interaktif ini banyak digunakan dalam ilmu data, penelitian dan pendidikan untuk tugas -tugas seperti analisis data, visualisasi dan konsep pemrograman pengajaran.
Sejak diluncurkan pada tahun 2017, Google Colab telah menjadi salah satu platform data dan pendidikan data yang paling banyak digunakan untuk Machine Learning (ML).
Sebagai Ori Abramovsky, Ilmu Data memimpin di spectralops.io, dirinci dalam pos menengah yang sangat baik dari tahun 2023, kemudahan penggunaan Colab dan akses gratis ke GPU dan TPU menjadikannya pilihan yang menonjol bagi banyak pengembang dan peneliti.
Dia mencatat bahwa penghalang yang rendah untuk masuk, integrasi tanpa batas dengan Google Drive dan dukungan untuk TPU memungkinkan timnya untuk secara dramatis mempersingkat siklus pelatihan saat mengerjakan model AI.
Namun, Abramovsky juga menunjukkan keterbatasan Colab, seperti:
- Batas waktu sesi (terutama untuk pengguna tingkat bebas).
- Alokasi sumber daya yang tidak dapat diprediksi pada waktu penggunaan puncak.
- Kurangnya fitur kritisseperti eksekusi pipa yang efisien dan penjadwalan lanjutan.
- Tantangan mendukungkarena Google menyediakan opsi terbatas untuk bantuan langsung.
Terlepas dari kelemahan ini, Abramovsky menekankan bahwa Colab tetap menjadi salah satu solusi notebook tanpa server terbaik yang tersedia – terutama pada tahap awal proyek analisis ML dan data.
Menyederhanakan analisis data dengan AI
Agen sains data dibangun di lingkungan notebook tanpa server Colab dengan menghilangkan kebutuhan untuk pengaturan manual.
Menggunakan Google Gemini AI, pengguna dapat menggambarkan tujuan analitik mereka dalam bahasa Inggris biasa (“Visualisasikan tren,” “Latih model prediksi,” “Nilai Bersih yang Hilang”), dan agen menghasilkan notebook Colab yang sepenuhnya dapat dieksekusi sebagai tanggapan.
Itu mendukung pengguna dengan:
- Analisis Mengotomatisasi: Menghasilkan buku catatan lengkap dan berfungsi alih -alih cuplikan kode yang terisolasi.
- Menghemat waktu: Menghilangkan pengaturan manual dan pengkodean berulang.
- Meningkatkan kolaborasi: Fitur fitur berbagi bawaan untuk proyek berbasis tim.
- Menawarkan solusi yang dapat dimodifikasi: Pengguna dapat menyesuaikan dan menyesuaikan kode yang dihasilkan.
Agen Ilmu Data sudah mempercepat penelitian ilmiah dunia nyata
Menurut Google, penguji awal telah melaporkan penghematan waktu yang signifikan saat menggunakan agen ilmu data.
Misalnya, seorang ilmuwan di Lawrence Berkeley National Laboratory yang bekerja pada emisi metana lahan basah tropis memperkirakan bahwa waktu pemrosesan data mereka turun dari satu minggu menjadi hanya lima menit saat menggunakan agen.
Alat ini juga berkinerja baik dalam tolok ukur industri, peringkat ke-4 di dabstep: tolok ukur agen data untuk penalaran multi-langkah untuk memeluk wajah, di depan agen AI seperti React (GPT-4.0), Deepseek, Claude 3.5 Haiku dan Llama 3.3 70b.
Namun, saingan Openai, O3-Mini dan model O1, serta Anthropic's Claude 3.5 Sonnet, keduanya mengungguli agen ilmu data Gemini baru.
Memulai
Pengguna dapat mulai menggunakan Agen Ilmu Data di Google Colab dengan mengikuti langkah -langkah ini:
- Buka Colab Notebook baru.
- Unggah dataset (CSV, JSON, dll.).
- Jelaskan analisis dalam bahasa alami menggunakan panel samping Gemini.
- Jalankan notebook yang dihasilkan untuk melihat wawasan dan visualisasi.
Google memberikan kumpulan data sampel dan ide -ide cepat untuk membantu pengguna mengeksplorasi kemampuannya, termasuk:
- Survei Pengembang Stack Overflow: “Visualisasikan bahasa pemrograman paling populer.”
- Dataset spesies iris: “Hitung dan visualisasikan korelasi Pearson, Spearman dan Kendall.”
- Dataset Klasifikasi Kaca: “Latih pengklasifikasi hutan acak.”
Kapan saja pengguna ingin menggunakan agen baru, mereka harus menavigasi ke Colab dan mengklik “File,” kemudian “Notebook baru di drive,” dan notebook yang dihasilkan akan disimpan di akun Google Drive Cloud mereka.
Penggunaan demo singkat saya sendiri lebih beragam
Memang, saya seorang jurnalis teknologi rendah dan bukan ilmuwan data, tetapi penggunaan saya sendiri dari agen sains data Gemini 2.0 yang baru di Colab sejauh ini kurang mulus.
Saya mengunggah lima file CSV (nilai terpisah koma, file spreadsheet standar dari Excel atau lembar) dan menanyakannya “Berapa banyak yang saya habiskan setiap bulan dan kuartal untuk utilitas saya?”.
Agen pergi ke depan dan melakukan operasi berikut:
- Dataset gabunganMenangani Tanggal dan Nomor Akun Inkonsistensi.
- Menyaring dan membersihkan datamemastikan hanya pengeluaran yang relevan.
- Transaksi yang dikelompokkan pada bulan dan kuartal untuk menghitung pengeluaran.
- Visualisasi yang dihasilkanseperti bagan garis untuk analisis tren.
- Temuan yang dirangkum Dalam laporan yang jelas dan terstruktur.
Sebelum dieksekusi, Colab meminta pesan konfirmasi, mengingatkan saya bahwa itu mungkin berinteraksi dengan API eksternal.
Itu melakukan semua ini dengan sangat cepat dan lancar di browser, dalam hitungan detik. Dan itu mengesankan untuk menyaksikannya bekerja melalui analisis dan pemrograman dengan deskripsi langkah demi langkah yang terlihat tentang apa yang dilakukannya.
Namun, itu pada akhirnya menghasilkan grafik yang tidak akurat yang menunjukkan hanya pengeluaran utilitas satu bulan, gagal mengenali lembaran termasuk satu tahun penuh nilai yang dipecat selama berbulan -bulan. Ketika saya memintanya untuk merevisi, itu dengan gagah dicoba, tetapi pada akhirnya tidak dapat menghasilkan string kode yang benar untuk menjawab prompt saya.

Saya mencoba dari awal dengan prompt yang sama persis di buku catatan baru di Google Colab, dan menghasilkan hasil yang jauh lebih baik, namun masih aneh.

Saya harus mencoba memecahkan masalah lagi, dan seperti yang saya katakan, hasil awal yang salah mungkin karena kurangnya pengalaman saya sendiri menggunakan alat sains data.
Harga colab dan fitur AI
Sementara Google Colab tetap gratis, pengguna yang membutuhkan daya komputasi tambahan dapat meningkatkan ke paket berbayar:
- Colab Pro ($ 9,99/bulan): 100 unit komputasi, GPU yang lebih cepat, lebih banyak memori, akses terminal.
- Colab Pro+ ($ 49,99/bulan): 500 unit komputasi, peningkatan prioritas GPU, eksekusi latar belakang.
- Colab Enterprise: Google Cloud Integration, pembuatan kode bertenaga AI.
- Pay-as-you-go: $ 9,99 untuk 100 unit komputasi, $ 49,99 untuk 500 unit komputasi.
Selain Agen Ilmu Data, Google telah memperluas kemampuan AI dalam Colab.
Google mengumpulkan petunjuk, kode yang dihasilkan, dan umpan balik pengguna untuk meningkatkan model AI -nya. Sementara data disimpan hingga 18 bulan, itu dianonimkan, dan permintaan penghapusan mungkin tidak selalu dipenuhi. Pengguna disarankan untuk tidak mengirimkan informasi sensitif atau pribadi, karena pengulas manusia dapat memproses permintaan. Selain itu, kode yang dihasilkan AI harus ditinjau dengan hati-hati, karena mungkin mengandung ketidakakuratan.
Umpan balik selamat datang
Google mendorong pengguna untuk memberikan umpan balik melalui komunitas Discord Google Labs di saluran #-science-agent.
Dengan otomatisasi yang digerakkan AI menjadi tren utama dalam ilmu data, agen ilmu data Google di Colab dapat membantu para peneliti dan pengembang lebih fokus pada wawasan dan lebih sedikit pada pengaturan pengkodean. Saat alat ini berkembang ke lebih banyak pengguna dan wilayah, akan menarik untuk melihat bagaimana ia membentuk masa depan analitik yang dibantu AI.