
Bergabunglah dengan buletin harian dan mingguan kami untuk mendapatkan pembaruan terkini dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari Lebih Lanjut
Membuat gambar AI generatif yang canggih memang menyenangkan dan bermanfaat, namun bukan hanya itu yang dibutuhkan perusahaan.
Pembuatan teks-ke-gambar perusahaan lebih dari sekadar membuat gambar. Ini tentang integrasi dengan alur kerja yang ada dan alat AI perusahaan lainnya. Ini adalah arah yang dipahami oleh Stability AI, vendor di balik Stable Diffusion.
Hari ini, Stability AI dan Amazon Web Services (AWS) bersama-sama mengumumkan bahwa Stable Diffusion 3.5 Large tersedia di layanan Amazon Bedrock. AWS adalah satu-satunya layanan cloud publik yang menawarkan model Stability AI andalan.
Langkah ini bukan hanya tentang ketersediaan sederhana. Ini tentang integrasi dan strategi masuk ke pasar yang memberikan lebih banyak semangat pada upaya Stability AI seiring dengan CEO baru perusahaan yang membawa fokus baru untuk memenuhi kebutuhan pelanggan. Amazon Bedrock menyediakan API tunggal terpadu yang memungkinkan perusahaan mengakses dan menggunakan beberapa model AI, termasuk Difusi Stabil. Hal ini penting, karena penelitian AWS menunjukkan bahwa sebagian besar perusahaan menggunakan lebih dari satu model dalam satu waktu. Ini adalah pendekatan yang sudah dimanfaatkan oleh pengguna, termasuk National Football League (NFL) dan Stride Learning.
Penerapan Amazon Bedrock Stable Diffusion 3.5 dilakukan saat Stability AI menghadapi lanskap yang semakin kompetitif dengan para pesaingnya, antara lain Google, Midjourney, Ideogram, dan Flux Pro dari Black Forest Labs. Perusahaan ini bertujuan untuk membedakan dengan lebih banyak keragaman citra dalam hal gaya, kepatuhan yang cepat, dan alur kerja perusahaan.
“Ada alasan kami menggunakan AWS,” Prem Akkaraju, CEO Stability AI, mengatakan kepada VentureBeat dalam sebuah wawancara eksklusif. “Itu karena di sanalah para pengembang dan pencipta berada, dan kami ingin membawa alat dan model kami ke tempat mereka berada. Tujuan kami adalah memberdayakan pembuat konten profesional.”
AWS memiliki teknologi pembuatan gambarnya sendiri, mengapa memerlukan Difusi Stabil?
Lanskap AI generasi text-to-image yang semakin kompetitif juga mencakup model dari Amazon. Pada awal Desember, rangkaian model Amazon Nova AI diumumkan, termasuk model pembuatan gambar.
Baskar Sridharan, VP layanan dan infrastruktur AI dan ML di AWS mengatakan kepada VentureBeat bahwa memiliki beberapa model pembuatan teks-ke-gambar memberikan pilihan bagi pengguna. Amazon Bedrock menyediakan satu API terpadu untuk pengguna, sehingga mereka dapat memilih untuk menerapkan model apa pun yang tersedia di platform menggunakan API yang sama. Sridharan juga mencatat bahwa AWS menyediakan alat evaluasi model yang dapat membantu perusahaan memilih alat terbaik untuk penerapan tertentu.
Tidak mengherankan, Akkaraju melihat Stable Diffusion 3.5 lebih unggul dari model lainnya. Ini merupakan pernyataan bahwa Stabilitas AI telah didukung melalui tolok ukur yang dilaporkan mengenai kepatuhan yang cepat.
“Kami menunjukkan dalam penelitian kami bahwa Stable Diffusion 3.5 Large memimpin pasar dalam hal kepatuhan yang cepat, memungkinkan model untuk mengikuti perintah teks tertentu dan benar-benar menjadikannya pilihan utama untuk efisiensi dan kinerja berkualitas tinggi,” kata Akkaraju.
Bagaimana perusahaan dapat menyesuaikan Difusi Stabil ke dalam alur kerja AI Amazon Bedrock
Difusi Stabil 3.5 berukuran besar telah tersedia untuk pengguna Stability AI melalui API perusahaan serta layanan Stable Assistant sejak akhir Oktober.
Stability AI tidak melihat perbedaan harga nyata antara menggunakan Stable Diffusion pada API-nya atau melalui Amazon Bedrock. Manfaat nyata bagi pengguna perusahaan dengan Difusi Stabil yang kini tersedia di Amazon Bedrock adalah kemampuan untuk menyesuaikan diri dengan alur kerja perusahaan yang lebih besar dan kompleks. Perusahaan bisa mendapatkan keuntungan dari alur kerja terpadu yang menggabungkan beberapa model dari vendor berbeda ke dalam satu API.
Ini adalah pendekatan yang sudah digunakan NFL.
NFL memiliki aplikasi bernama “Penyebab Saya, Cleat Saya” yang menggunakan Amazon Bedrock untuk memungkinkan pengalaman kolaboratif yang berfokus pada komunitas untuk membuat desain cleat khusus. Sridharan menjelaskan, aplikasi tersebut menggunakan Anthropic Claude dan Stable Diffusion. NFL menggunakan Claude untuk membuat petunjuk terperinci yang memahami preferensi pengguna dan menentukan apa yang mereka inginkan. Prompt itu kemudian dimasukkan ke Difusi Stabil untuk menghasilkan gambar. Seluruh proses dan alur kerja dilakukan di Amazon Bedrock tanpa perlu berpindah antar layanan yang berbeda.
Organisasi lain yang mendapat manfaat dari integrasi ini adalah vendor pendidikan Stride Learning. Perusahaan memerlukan gambar untuk mendukung game pembelajaran online Legends Library — banyak gambar, hingga 1.000 gambar per menit. Amazon Bedrock menyediakan infrastruktur untuk mendukung skala tersebut untuk menjalankan Difusi Stabil. Selain skala performa tinggi, ada juga kebutuhan untuk mengamankan keluaran pembuatan gambar. Di situlah Amazon Bedrock Guardrails API cocok. Sridharan mencatat bahwa dengan pagar pembatas, Stride Learning mampu memenuhi kebijakan AI yang bertanggung jawab untuk menghasilkan gambar.
“Ketika Anda melakukan semua ini menggunakan satu titik akhir API, pelanggan akan sangat mudah membangun aplikasi semacam ini,” kata Sridharan.
Stabilitas AI yang penting pada tahun 2024 dan masa depan dengan kepemimpinan barunya
Pembaruan dan ketersediaan Stable Diffusion 3.5 di Amazon Bedrock menutup tahun penting bagi Stability AI.
Pendiri dan mantan CEO perusahaan, Emad Mostaque, mengundurkan diri pada bulan Maret di tengah kekhawatiran tentang fokus dan kurangnya pendapatan. Butuh waktu hingga bulan Juni bagi Stability AI untuk menemukan pengganti permanen dengan penunjukan Akkaraju.
Sejauh ini, Akkaraju telah memimpin serangkaian pembaruan model. Dia juga membantu mendatangkan investor baru seperti pendiri Napster Sean Parker dan penasihat termasuk direktur terkenal James Cameron pada bulan September. Akkaraju berasal dari latar belakang efek visual dan membantu membuat film termasuk karya Cameron Avatar. Dalam pandangannya, industri media visual profesional akan bertransformasi sepenuhnya dalam beberapa tahun ke depan, beralih ke konten yang dihasilkan daripada konten yang dirender.
“Merupakan hal yang baik bahwa kami banyak bekerja di bisnis kreatif, karena mereka mungkin adalah klien yang paling menuntut yang dapat kami minta,” kata Akkaraju.
Ke depannya, dia bercanda bahwa rencana Stability AI akan mendominasi dunia. Namun, dalam hal yang lebih serius, ia mengharapkan inovasi berkelanjutan seiring upaya perusahaannya memenuhi kebutuhan alur kerja nyata.
“Kami akan terus mendorong model ini ke depan,” kata Akkaraju. “Anda bahkan mungkin melihat kami merilis lagi model gambar kami berikutnya tahun depan dan tetap menjadi yang teratas.”