PuLID: Pure and Lightning ID Customization via Contrastive Alignment
MP3•בית הפרקים
Manage episode 441394547 series 2954468
תוכן מסופק על ידי Rob. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי Rob או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.
We propose Pure and Lightning ID customization (PuLID), a novel tuning-free ID customization method for text-to-image generation. By incorporating a Lightning T2I branch with a standard diffusion one, PuLID introduces both contrastive alignment loss and accurate ID loss, minimizing disruption to the original model and ensuring high ID fidelity. Experiments show that PuLID achieves superior performance in both ID fidelity and editability. Another attractive property of PuLID is that the image elements (e.g., background, lighting, composition, and style) before and after the ID insertion are kept as consistent as possible. Codes and models will be available at https://github.com/ToTheBeginning/PuLID
2024: Zinan Guo, Yanze Wu, Zhuowei Chen, Lang Chen, Qian He
https://arxiv.org/pdf/2404.16022v1
…
continue reading
2024: Zinan Guo, Yanze Wu, Zhuowei Chen, Lang Chen, Qian He
https://arxiv.org/pdf/2404.16022v1
298 פרקים