
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Black Forest Labs (BFL), startup yang didirikan oleh pencipta model difusi stabil yang populer, telah meluncurkan model pembuatan gambar baru yang disebut Flux.1 Kontext. Model ini tidak hanya menghasilkan dan mengedit foto, tetapi juga memungkinkan pengguna untuk memodifikasinya dengan teks dan gambar lainnya.
Perusahaan juga mengumumkan taman bermain BFL yang baru, di mana orang dapat mencoba model BFL sebelum melepaskan mereka pada aplikasi perusahaan.
BFL merilis dua versi model: Flux.1 Kontext [pro] dan flux.1 Kontext [max]. Versi ketiga, Flux.1 Kontext [dev] akan tersedia di beta pribadi. Baik versi Pro dan Max sekarang tersedia di platform seperti Kreaai, Freepik, Lightricks, OpenArt dan Leonardoai. Model -model ini memungkinkan tim kreatif perusahaan dan pengembang lain untuk mengedit gambar dengan presisi dan dengan kecepatan yang lebih cepat.
Flux.1 Kontext dapat melakukan pembuatan dalam konteks. Ini berarti model dapat dihasilkan dari referensi atau situasi yang disajikan kepadanya; itu tidak menghasilkan dari awal.
Perusahaan mengatakan dalam sebuah posting di X bahwa empat hal membuat Kontext “Special”:
- Konsistensi karakter dan elemen pelestarian di seluruh adegan
- Pengeditan lokal yang “menargetkan bagian tertentu tanpa mempengaruhi sisanya”
- Referensi gaya yang menghasilkan adegan dalam gaya yang ada, dan
Pengembang dapat menguji kasus penggunaan dan bermain dengan model di taman bermain BFL sebelum mengakses BFL API lengkap.
Model pro dan maks
Perusahaan dapat menggunakan versi Pro untuk pengeditan cepat dan berulang. Pengguna dapat memasukkan gambar teks dan referensi dan melakukan pengeditan lokal. Perusahaan itu mengatakan Kontext [pro] Mengoperasikan “hingga urutan besarnya lebih cepat dari model canggih sebelumnya” dan merupakan salah satu model pertama yang memungkinkan pengeditan pada beberapa belokan.
Di sisi lain, fluks.1 kontext [max] adalah versi yang lebih cepat dengan kinerja maksimum. Perusahaan mengatakan lebih menganut untuk meminta, membuat tipografi dapat dibaca dan konsisten dalam pengeditan tanpa kompromi.
Tentu saja, banyak model pembuatan gambar lainnya juga dapat menghasilkan foto dari file yang diunggah. Editor gambar AI Midjourney dapat menggunakan gambar referensi dan kemudian mengedit wilayah tertentu. Begitu pula Adobe's Firefly, yang diakses oleh banyak orang yang menggunakan platform gambar dan video populer Adobe.
Flux.1 Kontext [dev]versi ketiga dari keluarga model Kontext, adalah model dengan berat badan dengan 12 miliar parameter.
Aliran generatif
BFL mengatakan fluks.1 Kontext adalah model aliran, yang memberikan lebih banyak fleksibilitas untuk menyelesaikan tugas yang disebutkan di atas.
Model aliran belajar dari aliran data yang berkelanjutan dan menentukan jalur antara data yang berisik dan informasi yang berguna. Ini berbeda dari difusi, arsitektur model yang menopang banyak model pembuatan gambar dan video dari stabilitas AI, Midjourney dan bahkan Openai's Sora, yang “Denoises” data.
“Flux.1 Model Kontext melampaui teks-ke-gambar,” kata perusahaan itu. “Tidak seperti model aliran sebelumnya yang hanya memungkinkan untuk generasi berbasis teks murni, fluks.1 model kontext juga memahami dan dapat membuat dari gambar yang ada. Dengan fluks.1 kontext Anda dapat memodifikasi gambar input melalui instruksi teks sederhana, memungkinkan pengeditan gambar yang fleksibel dan instan-tidak perlu untuk finetuning atau alur kerja pengeditan kompleks.”
Dalam uji benchmark teks-ke-gambar, BFL mengklaim fluks.1 model kontext dapat bersaing dengan model lain dalam hal estetika, mengikuti petunjuk, realisme, dan tipografi.
Menghasilkan minat
Bfl merilis mod teks-ke-gambarEl Flux 1.1 Pro pada Oktober tahun lalu. Ini juga termasuk API untuk pengembang pihak ketiga untuk mengintegrasikannya ke dalam aplikasi mereka.
Berkat BFL Playground, beberapa pengguna sudah mulai bermain -main dengan model Kontext dan melaporkan terkesan.
Tentu saja, masih harus bersaing dengan model gambar lain yang tersedia, terutama yang telah ada selama beberapa tahun dan terus meningkat.