
Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut
Perusahaan Desain Grafis Napkin AI mengukir jalur unik di area perbatasan yang menarik dari aplikasi agen AI vertikal.
Seorang pengguna dapat mengetik beberapa teks di situs web serbet AI, dan serbet menghasilkan grafik yang mewakili teks Anda dalam waktu lima detik.
Yang menarik adalah bahwa di bawah tenda, serbet melakukan ini dengan mengambil pekerjaan tradisional yang berbeda dari agensi desain – copywriter, perancang, ilustrator, stylist merek – dan mereplikasi fungsi diskrit tersebut dengan agen AI individu – alih -alih dengan manusia.
Produk ini mendapatkan daya tarik yang mengesankan sejak diluncurkan pada bulan Agustus. Ini memiliki 2 juta pengguna beta, dua kali lipat jumlah pengguna hanya enam minggu yang lalu, menurut Pramod Sharma, salah satu pendiri dan CEO Napkin.
“Kami telah mengambil sudut yang sedikit berbeda,” katanya dalam sebuah wawancara dengan VentureBeat. “Kami tidak memulai: 'Mari kita lihat model gambar dan lihat apa yang bisa dilakukan.' Bahkan, bagi kami itu adalah renungan. Ini benar -benar tentang apa yang diperlukan untuk membuat grafik, dan bagaimana hal itu dilakukan hari ini, dan bekerja mundur. “
Serbet ai adalah bagian dari tren menuju agen AI vertikal
Napkin adalah bagian dari semakin banyak startup yang bermunculan untuk melayani area vertikal dengan produk yang tidak didorong oleh model SaaS yang berkuasa, tetapi oleh agen AI vertikal yang berada di bawah kap mesin. Napkin menunjukkan betapa produktifnya perusahaan agen ini. Ini adalah tim yang terdiri dari 12 orang yang bekerja dari jarak jauh, dengan Sharma satu -satunya yang tinggal di SF Bay Area. Perusahaan -perusahaan ini juga berjanji untuk menjadi sangat mengganggu, karena mereka jauh lebih dapat disesuaikan dan kuat untuk kasus penggunaan spesifik mereka.
Untuk menyelam lebih dalam ke pendekatan serbet AI, termasuk wawasan dari rekan pendiri tentang bagaimana sistem agen mereka bekerja, lihat percakapan saya dengan Sam Witteveen, pengembang agen AI, dan tim serbet dalam video YouTube ini ini:
Apa yang tampaknya membedakan serbet dari kompetisi di ruangnya sendiri adalah fokusnya untuk melayani kebutuhan tertentu: membantu para profesional yang bukan ahli desain grafik untuk membuat desain yang cantik, terutama untuk presentasi PowerPoint. Pengguna ini menginginkan diagram dan ilustrasi lainnya, dan bukan hanya gambar licin yang diproduksi oleh banyak penyedia AI generatif – dan mereka ingin dapat mengedit gambar ini dengan mudah dan sederhana. Dan itulah yang dilakukan Napkin: Setelah memberikan pengembalian terbaik kepada pengguna dalam waktu lima detik, itu memungkinkan pengguna mengeditnya untuk hal -hal seperti gaya, warna, dan jenis desain. (Lihat gambar di bawah ini misalnya gambar yang diberikan oleh serbet)
Napkin AI mewakili cara ketiga
Napkin tidak menggunakan model AI difusi yang digunakan oleh sebagian besar penyedia gambar lainnya, CEO Sharma mengatakan, karena model -model tersebut tidak memungkinkan pengguna untuk dengan mudah mengedit elemen ilustrasi yang unik, misalnya irisan diagram lingkaran, atau teks sekitarnya. Dengan mendasari produk serbet dengan agen yang melayani fungsi spesifik dan bermanfaat, pendekatan Napkin mewakili “cara ketiga.”
“Cara pertama,” yang diambil oleh orang-orang sezaman desain grafis yang berkuasa seperti Adobe atau Canva, adalah untuk mengarahkan alat AI ke alur kerja desain tradisional. Napkin tidak melakukan ini. Ini adalah AI-first generatif, karena menggunakan AI generatif untuk membuat draf visual terbaik terbaik yang bisa, berdasarkan pada prompt pengguna. Kemudian menyederhanakan proses pengeditan yang tersisa, mengingat bahwa sebagian besar pengguna tidak memiliki keterampilan desain canggih – jenis yang Anda butuhkan, misalnya, untuk mencari tahu Adobe Creative Cloud.
Tidak ada serbet mengikuti “cara kedua”, yaitu jenis baru perusahaan gambar dan video AI, seperti midjourney, difusi stabil, landasan pacu, ideogram, dan lainnya-yang bangga menjadi ai-pertama, dan menggunakan model difusi masif untuk Pengguna Bamboozle dengan gambar atau video berkualitas tinggi. Seringkali tidak jelas bagaimana mereka berdiferensiasi satu sama lain. Napkin, bagaimanapun, bertekad untuk tidak jatuh di bawah pingsan teknologi yang luar biasa demi itu, karena itu tidak mengutamakan pengguna, kata Sharma.
Begini cara kerja serbet AI: ini memungkinkan pengguna untuk menempelkan deskripsi teks-apakah ini prompt presentasi, kutipan blog, atau brainstorming note-dan menerima beberapa opsi grafis berkualitas tinggi dalam hitungan detik. Grafik ini bukan hanya templat tetapi desain yang dapat disesuaikan, dengan font, warna, dan tata letak yang dapat diedit – tetapi mudah digunakan, dengan alat geser. Produk ini menghindari bilah menu besar dengan ratusan opsi yang disediakan oleh alat yang lebih kompleks seperti Figma atau Canva. Setelah membuat gambar, serbet memungkinkan Anda untuk mengekspornya dalam format PNG, PDF atau SVG.
Napkin AI memiliki empat sub-agen di bawah kap
Namun, yang lebih menarik adalah bagaimana agen bekerja di bawah kap: serbet menggunakan orkestrator LLM, terutama didorong oleh Openai GPT-4O Mini, untuk menanggapi prompt pengguna. LLM ini bertindak sebagai agen, mendelegasikan pekerjaan ke serangkaian sub-agen lain yang memiliki tanggung jawab khusus. Agen “teks” pertama menyarankan beberapa teks yang dapat digunakan dalam desain. Agen “tata letak” kedua melihat teks, dan memutuskan tata letak desain tertentu yang terbaik untuk teks itu. Agen “ikon dan ilustrasi” ketiga memeriksa database untuk melihat apakah ada ikon yang cocok dengan permintaan teks, dan jika tidak ada, itu mungkin menghasilkan ikon dengan cepat. Akhirnya, ada agen “gaya” keempat, yang memungkinkan pengguna menyesuaikan desain dengan warna dan gaya perusahaan mereka sendiri. Seperti yang dijelaskan oleh CEO Sharma, serbet tidak terlalu banyak menguasai keempat agen ini, selain memaksimalkan kualitas dan kecepatan. Menanggapi dalam waktu lima detik adalah kunci bagi pelanggan yang menyenangkan, kata Sharma.
Setiap “agen” berkontribusi pada komposisi keseluruhan, memastikan grafik yang dihasilkan tidak hanya menyenangkan secara estetika tetapi juga disesuaikan dengan niat pengguna.
Agen keempat, “Styling” akan dimasukkan ke dalam produk minggu depan, dan akan ada perbaikan dari waktu ke waktu, kata Sharma. Segera, pengguna akan dapat mengunggah tangkapan layar atau dokumen lain dari gaya perusahaan mereka, sehingga model gambar dapat secara otomatis menghasilkan gambar dengan gaya itu. Dia mengutip penelitian yang dilakukan oleh meta di bidang model konsep besar (LCM) yang dapat membantu di sini. Namun, untuk saat ini, agen Napkin adalah mesin rendering yang menawarkan berbagai opsi gaya untuk pengguna melalui dasbor.

Kualitas dan fokus sebagai pembeda
Salah satu komitmen Napkin yang paling mencolok adalah fokusnya pada kualitas. Untuk Sharma, tujuannya bukan hanya untuk menghasilkan visual dengan cepat – ini untuk memastikan setiap grafik layak digunakan. “Kami mengambil konten tertulis Anda dan mengubahnya menjadi grafik yang benar -benar menangkap esensi ide Anda,” kata Sharma. “Kami menyadari bahwa dalam grafik, bagus tidak cukup. Itu harus sangat, sangat bagus. Kalau tidak, ia mengalahkan tujuannya. ”
Sharma ikut mendirikan Napkin AI dengan Jerome Scholler, setelah berbagi frustrasi bersama di sekitar kualitas deck presentasi. Sebelum memulai serbet, Sharma membangun perusahaan permainan pendidikan anak -anak Osmo, yang juga dikenal dengan kualitas desain. Scholler juga merupakan bagian dari tim pendiri Osmo. Sharma juga mantan googler.
Obsesi seputar kualitas ini meluas ke dasar -dasar teknis. Tidak seperti model difusi yang sering tidak memiliki pemahaman semantik tentang grafik, platform yang digerakkan oleh agen Napkin memungkinkannya untuk memisahkan elemen seperti konten, tata letak, dan gaya. Decoupling ini memungkinkan pengguna untuk memodifikasi konten secara dinamis tanpa kehilangan integritas desain.
Traksi dan ekspansi
Pasar tampaknya setuju dengan pendekatan Napkin. Platform ini telah menggandakan penggunanya dalam enam minggu terakhir, dan menunjukkan tingkat retensi yang kuat, menunjukkan bahwa pengguna seperti alur kerja yang mendasarinya. Setelah beberapa minggu digunakan, “Pengguna seperti: 'Beri saya lebih banyak!'” Kata Sharma. “'Bisakah Anda memperluas katalognya? Kemungkinannya? Jenis ilustrasi? ' Ini baik untuk kami karena kami sangat fokus sekarang. “
Namun, yang menarik adalah bahwa untuk komunikasi visual, desain tertentu bekerja dengan baik, dan yang lainnya tidak. Otak manusia dapat dengan mudah memahami diagram lingkaran dan batang, misalnya, tetapi dapat memiliki waktu yang lebih sulit dengan desain lain. “Apa yang telah kami pelajari tentang ruang tersebut adalah bahwa struktur itu sendiri tidak terbatas,” kata Sharma. “Mereka adalah struktur atau metafora yang jelas yang biasanya digunakan orang, tetapi bagaimana Anda membuatnya? Bagaimana Anda mengilustrasikan metafora itu? Di situlah banyak kreativitas datang, dan kami sebenarnya sedang berupaya memperluas itu secara dramatis. ”
Perusahaan mengumpulkan putaran benih $ 10 juta pada bulan Agustus, dan keluar dari sembunyi -sembunyi pada waktu itu (lihat cakupan VentureBeat pada saat itu). Tapi sudah tiga tahun sejak mereka mulai mengerjakan masalah ini. “Aku bisa memberitahumu itu masih masalah yang sangat sulit,” kata Sharma. “Manusia sangat pandai membaca grafik, dan mencari tahu apakah grafiknya bagus. Mereka tidak tahu bagaimana membuatnya, tetapi mereka dapat menilai satu dengan sangat, sangat cepat. ”
Masa depan serbet ai
Sebagai pemain yang lebih besar seperti Canva dan Adobe Eye ruang AI generatif, diferensiasi jelas serbet AI dapat menjadikannya target akuisisi. Apakah sebagai pengganggu independen atau komponen penting dari ekosistem yang lebih besar, serbet AI tidak diragukan lagi adalah salah satu yang ditonton di lanskap grafis AI generatif.