
Bergabunglah dengan acara yang dipercaya oleh para pemimpin perusahaan selama hampir dua dekade. VB Transform menyatukan orang -orang yang membangun strategi AI perusahaan nyata. Pelajari lebih lanjut
Bright Data, perusahaan pengikis web Israel yang mengalahkan Meta dan Elon Musk X di pengadilan federal, meluncurkan suite infrastruktur AI komprehensif Rabu yang dirancang untuk memberikan sistem intelijen buatan yang tidak terkekang akses ke data web real-time-kemampuan perusahaan berpendapat bahwa platform teknologi besar berusaha memonopoli.
Pengumuman protokol dalam, browser.ai, dan peningkatan protokol pengumpulan data yang ditingkatkan merupakan ekspansi dramatis untuk perusahaan yang telah berusia dekade, yang telah berubah dari layanan goresan web khusus menjadi apa yang disebut CEO atau Lenchner “lapisan infrastruktur unik untuk perusahaan AI.” Langkah ini dilakukan ketika perusahaan intelijen buatan semakin berjuang untuk mengakses informasi web saat ini yang diperlukan untuk memberi daya pada chatbots, agen otonom, dan aplikasi AI lainnya.
“Kecerdasan LLMS saat ini bukan lagi faktor pembatasnya; aksesnya,” kata Lenchner dalam wawancara eksklusif dengan VentureBeat. “Kami telah menghabiskan dekade terakhir untuk memperjuangkan akses terbuka ke data web publik, dan penawaran baru ini membawa kami ke bab berikutnya dalam perjalanan kami, yang ditandai dengan data yang benar-benar dapat diakses dan peningkatan selanjutnya dari agen yang sadar kontekstual.”
Peluncuran ini mengikuti kemenangan hukum terkenal Data Bright pada tahun 2024, ketika hakim federal menolak tuntutan hukum dari Meta dan X menuduh perusahaan secara ilegal menggores platform mereka. Putusan -keputusan itu menetapkan preseden hukum penting yang mendefinisikan apa yang merupakan “data publik” di internet – informasi yang dapat dilihat tanpa masuk dan karenanya dapat dikumpulkan dan digunakan secara hukum.
Kasus -kasus pengadilan mengungkapkan bahwa baik meta dan x telah menjadi pelanggan data yang cerdas bahkan saat menggugat perusahaan, menyoroti sikap kontradiktif yang diambil banyak raksasa teknologi terhadap pengikisan web. Putusan tersebut memiliki implikasi yang lebih luas untuk industri AI, yang sangat bergantung pada data web untuk melatih dan mengoperasikan model bahasa.
“Terungkap di pengadilan bahwa keduanya adalah pelanggan data yang cerdas, karena semua orang membutuhkan data, semua orang, terutama mereka yang membangun model,” jelas Lenchner. “Kami adalah satu -satunya perusahaan yang memiliki sumber daya keuangan, dan saya bahkan akan mengatakan keberanian untuk melakukan itu.”
Hakim William Alsup, yang memimpin kasus X, menulis bahwa memberi perusahaan media sosial “bebas untuk memutuskan, atas dasar apa pun, yang dapat mengumpulkan dan menggunakan data” berisiko menciptakan “monopoli informasi yang akan melayani kepentingan publik.” Putusan tersebut menetapkan bahwa data yang dapat dilihat tanpa kredensial login merupakan informasi publik yang dapat dikikis secara hukum.
Bright Data sebelumnya telah mengajukan gugatan balik terhadap X, menuduh platform tersebut melanggar undang -undang antimonopoli dengan mencoba membuat monopoli data untuk menguntungkan perusahaan AI Musk, XAI. Namun, kasus itu telah diselesaikan. “Meskipun istilah rahasia, data yang cerah tidak pernah mundur dari keyakinan mendasar bahwa data publik harus tersedia untuk umum. Konsisten dengan keyakinan itu, kami senang melaporkan bahwa data yang cerah akan terus memberikan layanan terkemuka industri yang sama yang selalu dimiliki dan bahwa pelanggan kami telah datang untuk datang,” kata Lenchner.
Pencarian mendalam dan browser.ai perusahaan target AI yang berjuang dengan akses data
Produk baru perusahaan membahas apa yang diidentifikasi Lenchner sebagai tiga persyaratan inti untuk sistem AI: algoritma, daya komputasi, dan akses data. Meskipun data yang cerah tidak mengembangkan algoritma AI atau menyediakan sumber daya komputasi, ini bertujuan untuk menjadi solusi definitif untuk persyaratan ketiga.
Fungsi pencarian yang dalam sebagai mesin penelitian bahasa alami yang dirancang untuk menjawab pertanyaan bisnis yang kompleks dan berlapis-lapis secara real-time. Tidak seperti mesin pencari tujuan umum atau chatbots AI yang memberikan ringkasan, pencarian mendalam berspesialisasi dalam hasil yang komprehensif untuk pertanyaan yang dimulai dengan “Find All.” Misalnya, pengguna dapat meminta “semua perusahaan pengiriman yang melewati kanal Panama dan Suez pada tahun 2023 yang pendapatan Q3 -nya menurun lebih dari 2 persen.”
Sistem ini menarik dari arsip web besar -besaran Data Bright, yang saat ini berisi lebih dari 200 miliar halaman HTML dan menambahkan 15 miliar per bulan. Pada tahun depan, arsip diperkirakan akan melebihi 500 miliar halaman. “Ini bukan hanya halaman web acak, sebenarnya yang dipedulikan dunia, karena 20.000 pelanggan kami mewakili miliaran pengguna internet,” kata Lenchner.
Browser.ai mewakili apa yang disebut perusahaan sebagai “peramban asli yang tidak dapat diblokir di industri ini.” Dirancang khusus untuk agen AI otonom, layanan berbasis cloud meniru perilaku manusia untuk mengakses situs web tanpa memicu sistem deteksi bot. Ini mendukung perintah bahasa alami dan dapat melakukan interaksi web yang kompleks seperti memesan penerbangan atau membuat reservasi restoran.
Infrastruktur browser sudah memproses lebih dari 150 juta aksi web setiap hari, menurut perusahaan. “Hampir semuanya adalah pelanggan,” kata Lenchner tentang perusahaan agen AI yang telah mengumpulkan dana yang signifikan. “Karena apa yang kami ketahui, dan mereka tahu, adalah bahwa kami menyelesaikan masalah memasuki situs web tanpa diblokir dan menjalankan tindakan web di situs web.”
Server MCP (Model Context Protocol) menyediakan lapisan kontrol latensi rendah yang memungkinkan agen AI untuk mencari, merangkak, dan mengekstrak data langsung secara real-time. Protokol memungkinkan pengembang untuk membangun sistem AI yang dapat bertindak berdasarkan informasi saat ini daripada hanya mengandalkan data pelatihan.
Portofolio Paten dan Jaringan Proxy Membuat parit kompetitif terhadap pemblokiran
Keunggulan kompetitif Data Bright berasal dari apa yang digambarkan Lenchner sebagai “obsesi” dengan mengatasi mekanisme pemblokiran situs web. Perusahaan ini memiliki lebih dari 5.500 klaim paten tentang teknologinya dan mengoperasikan jaringan proxy terbesar di dunia dengan lebih dari 150 juta alamat IP di 195 negara.
“Kami memiliki pandangan yang baik ke internet,” Lenchner menjelaskan. “Untuk waktu yang lama sekarang, kami telah memetakan internet, dan untuk waktu yang lama sekarang, kami juga mengarsipkan potongan besar internet.”
Pendekatan perusahaan melibatkan teknik canggih untuk meniru perilaku manusia, menggunakan perangkat nyata, alamat IP, dan sidik jari browser daripada skrip otomatis sederhana. Ini membuat deteksi dan memblokir sangat sulit untuk situs web.
“Satu -satunya cara untuk memblokir kami, secara praktis, adalah dengan meletakkan data di belakang login, maka kami bahkan tidak akan mencoba,” kata Lenchner. “Kadang -kadang ada logika pemblokiran baru yang tidak akan segera kami selesaikan. Ini akan membutuhkan tim peneliti kami 12 jam, tiga hari yang paling seperti itu, dan kami akan membukanya.”
Pendapatan melampaui $ 100 juta karena permintaan AI meledak pasca-chatgpt
Sementara Data Bright tetap dipegang secara pribadi oleh perusahaan ekuitas swasta, Lenchner dikonfirmasi dengan VentureBeat, pendapatan berulang tahunan perusahaan melampaui $ 100 juta beberapa tahun yang lalu. Bisnis ini telah mengalami pertumbuhan eksplosif sejak peluncuran ChatGPT pada akhir 2022, karena perusahaan AI berebut untuk mengakses data pelatihan dan informasi waktu-nyata.
“Mulai Maret 2023, yang cukup banyak ketika GPT-3 mengubah dunia, AI, atau apa yang kami sebut data untuk AI, menggunakan kasing yang benar-benar meledak bagi kami sebagai perusahaan,” kata Lenchner. “Segala sesuatu yang lain juga berkembang, karena semua orang membutuhkan lebih banyak data, titik. Tetapi kasus penggunaan ini sama seperti tidak ada yang pernah kita lihat sebelumnya.”
Perusahaan ini melayani lebih dari 20.000 bisnis, termasuk perusahaan Fortune 500 dan laboratorium AI utama. Pelanggan tradisional termasuk platform e-commerce yang melacak harga pesaing, perusahaan jasa keuangan yang mencari kecerdasan pasar, dan perusahaan yang melakukan riset bisnis.
Kepatuhan GDPR dan Praktik Etis berdiferensiasi dari pesaing
Bright Data telah banyak berinvestasi dalam infrastruktur kepatuhan untuk mengatasi masalah privasi seputar pengumpulan data. Perusahaan mengikuti peraturan GDPR Eropa dan California CCPA, secara otomatis memberi tahu orang -orang ketika informasi pribadi mereka dikumpulkan dari sumber publik dan memberikan opsi penghapusan.
“Peraturan dan undang -undang tersebut jelas karena GDPR Eropa dan setidaknya peraturan California dan CCPA datang untuk bermain,” jelas Lenchner. “Jika kami mengumpulkan alamat email Anda, misalnya, kami akan secara otomatis mengirimi Anda email yang mengatakan, 'Hei, ini adalah siapa kami. Kami mengumpulkan informasi pribadi Anda dari domain publik. Berikut adalah tombol besar yang dapat Anda klik jika Anda ingin meninjaunya, dan Anda jelas dapat meminta untuk menghapusnya.'”
Perusahaan memelihara tim kepatuhan yang besar dan dokumentasi luas praktiknya, yang terbukti berharga selama proses pengadilan. “Kami perusahaan terutama mencintai kami karena kami memiliki pendirian etis kami yang diteliti di pengadilan AS dua kali,” kata Lenchner.
Perang Akses Web semakin meningkat sebagai raksasa teknologi mencari monopoli data
Pertarungan atas akses data web mencerminkan ketegangan yang lebih luas dalam industri AI tentang kontrol informasi dan keunggulan kompetitif. Ketika sistem AI menjadi lebih canggih, akses ke data web saat ini dan komprehensif menjadi semakin berharga – dan kontroversial.
Lenchner memprediksi web akan menjadi “lebih tertutup” dari waktu ke waktu, mirip dengan bagaimana Google mempertahankan akses eksklusif ke kemampuan merangkak webnya sementara yang lain harus menggunakan layanan alternatif. “Beberapa raksasa teknologi akan mendapatkan akses gratis ke setiap situs web dengan agen mereka,” katanya. “Sisanya perlu menggunakan infrastruktur kami atau infrastruktur orang lain.”
Perusahaan juga mengamati tren baru, termasuk bisnis yang menggosok AI Chatbots untuk tujuan pemasaran dan munculnya protokol baru seperti MCP yang memungkinkan agen AI untuk berinteraksi dengan layanan web secara lebih efektif.
“Semua orang ini yang mengkonsumsi data dalam jumlah besar, dan kita semua menggunakannya, semuanya digunakan untuk membangun otak robot,” kata Lenchner. “Tidak apa -apa kamu memiliki chatbot yang berbicara dengan manusia, karena pada akhirnya itulah yang akan dilakukan robot.”
Otak robot dan ekonomi agen mendorong fase pertumbuhan berikutnya
Transformasi Bright Data dari layanan pengikisan web ke penyedia infrastruktur AI mencerminkan kebutuhan yang berkembang pesat dari industri kecerdasan buatan. Ketika perusahaan bergegas untuk menggunakan agen AI dan sistem otonom, akses ke data web real-time menjadi sama pentingnya dengan daya komputasi dan kecanggihan algoritmik.
Preseden hukum yang ditetapkan melalui kemenangan pengadilan Bright Data dapat terbukti sama pentingnya dengan inovasi teknisnya, berpotensi membentuk bagaimana seluruh industri AI mengakses dan menggunakan informasi web. Dengan platform teknologi utama yang semakin membatasi akses data sambil secara bersamaan mengembangkan sistem AI mereka sendiri, penyedia infrastruktur independen seperti Bright Data mungkin menjadi penting untuk menjaga keseimbangan kompetitif di ekosistem AI.
“Kami adalah perusahaan infrastruktur,” Lenchner menekankan. “Kami insinyur yang sangat berbakat yang hampir tidak pergi ke mana pun, hanya duduk dengan komputer kami dan menulis kode. Kami melakukannya dengan baik. Kami tidak punya niat untuk melakukan hal lain.”
Deep Lookup Beta diluncurkan Selasa untuk pelanggan bisnis, dengan akses publik umum tersedia melalui daftar tunggu. Server Browser.AI dan MCP sudah tersedia untuk klien perusahaan melalui platform Bright Data yang ada.