התחל במצב לא מקוון עם האפליקציה Player FM !
Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model
Manage episode 435377413 series 3524393
Transfusion is a multi-modal training method combining language modeling and diffusion, achieving superior performance in generating images and text with models up to 7B parameters.
https://arxiv.org/abs//2408.11039
YouTube: https://www.youtube.com/@ArxivPapers
TikTok: https://www.tiktok.com/@arxiv_papers
Apple Podcasts: https://podcasts.apple.com/us/podcast/arxiv-papers/id1692476016
Spotify: https://podcasters.spotify.com/pod/show/arxiv-papers
--- Support this podcast: https://podcasters.spotify.com/pod/show/arxiv-papers/support
1633 פרקים
Manage episode 435377413 series 3524393
Transfusion is a multi-modal training method combining language modeling and diffusion, achieving superior performance in generating images and text with models up to 7B parameters.
https://arxiv.org/abs//2408.11039
YouTube: https://www.youtube.com/@ArxivPapers
TikTok: https://www.tiktok.com/@arxiv_papers
Apple Podcasts: https://podcasts.apple.com/us/podcast/arxiv-papers/id1692476016
Spotify: https://podcasters.spotify.com/pod/show/arxiv-papers
--- Support this podcast: https://podcasters.spotify.com/pod/show/arxiv-papers/support
1633 פרקים
כל הפרקים
×ברוכים הבאים אל Player FM!
Player FM סורק את האינטרנט עבור פודקאסטים באיכות גבוהה בשבילכם כדי שתהנו מהם כרגע. זה יישום הפודקאסט הטוב ביותר והוא עובד על אנדרואיד, iPhone ואינטרנט. הירשמו לסנכרון מנויים במכשירים שונים.