ComfyUI, un startup care ajută creatorii să controleze rezultatele imaginii, video și audio din modelele de difuzie cu un flux de lucru bazat pe noduri, a strâns o rundă de finanțare de 30 de milioane de dolari la o evaluare de 500 de milioane de dolari. Runda a fost condusă de Craft Ventures, cu participarea altor investitori, inclusiv Pace Capital, Chemistry și TruArrow.
ComfyUI a fost lansat ca un proiect open-source în 2023, la scurt timp după introducerea modelelor de difuzie. La acea vreme, modele precum Midjourney și DALL-E de la OpenAI erau abia funcționale, făcând frecvent greșeli majore, cum ar fi adăugarea de degete suplimentare la mâini. Pentru a aborda aceste limitări, fondatorii proiectului au dezvoltat un cadru modular care oferă creatorilor control granular asupra fiecărui pas al procesului de generare. Instrumentul lor a câștigat o tracțiune atât de semnificativă în rândul profesioniștilor creativi încât a evoluat în cele din urmă într-un startup formal. La sfârșitul anului 2024, ComfyUI a strâns 19 milioane de dolari în finanțare Seria A de la investitori, inclusiv Chemistry Ventures, Cursor Capital și Guillermo Rauch, fondatorul Vercel.
Deși cele mai recente modele de difuzie au parcurs un drum lung de la adăugarea unui al șaselea deget la mâini, nevoia de precizie granulară pe care o oferă ComfyUI nu a făcut decât să crească.
"Dacă te gândești la soluția tipică bazată pe prompturi, cum ar fi Midjourney sau ChatGPT, ceri ceva, [ajungi doar] la 60% - 80% acolo", a declarat Yoland Yan, co-fondator și CEO al ComfyUI, pentru TechCrunch. "Dar pentru a schimba acel 20% rămas, trebuie să încerci acest aparat de slot".
Yan a comparat procesul cu jocul într-un cazinou, deoarece solicitarea modelului să facă o mică schimbare poate duce la o ieșire complet diferită, inclusiv suprascrierea părților care erau deja perfecte.
Interfața bazată pe noduri a ComfyUI permite creatorilor să conecteze componente specifice ale procesului de generare, oferindu-le control deplin asupra calității rezultatului lor final. "Nu poți transmite cu ușurință acel mesaj în caseta de prompt [a unui model de bază]", a spus Yan.
Creatorii par să fie de acord, deoarece ComfyUI susține că are peste 4 milioane de utilizatori. Instrumentul este utilizat de profesioniști creativi pentru efecte vizuale, animație, publicitate și chiar design industrial. Startup-ul spune că oferta sa a devenit un instrument atât de necesar al comerțului pentru artiștii tehnici și alți creativi, încât nu este neobișnuit să vezi "artist sau inginer ComfyUI" listat ca funcție pe panourile de locuri de muncă din studio.
Deși modelele fundamentale de video și imagine continuă să se îmbunătățească, Yan susține că sunt departe de a fi perfecte, iar un instrument precum ComfyUI va continua să fie la mare căutare. "Într-o lume în care prostiile AI vor fi peste tot, versiunea Comfy a abordării om-în-buclă va câștiga în cele din urmă majoritatea ochilor", a spus el.
Concurenții ComfyUI includ Weavy, un startup care a fost achiziționat de Figma anul trecut.

