התחל במצב לא מקוון עם האפליקציה Player FM !
Summary of a Haystack: A Challenge to Long-Context LLMs and RAG Systems
Manage episode 427311110 series 3524393
SummHay introduces a task to evaluate LLMs and RAG systems on long-context tasks, highlighting challenges and proposing a reproducible evaluation method for system performance.
https://arxiv.org/abs//2407.01370
YouTube: https://www.youtube.com/@ArxivPapers
TikTok: https://www.tiktok.com/@arxiv_papers
Apple Podcasts: https://podcasts.apple.com/us/podcast/arxiv-papers/id1692476016
Spotify: https://podcasters.spotify.com/pod/show/arxiv-papers
--- Support this podcast: https://podcasters.spotify.com/pod/show/arxiv-papers/support
1557 פרקים
Manage episode 427311110 series 3524393
SummHay introduces a task to evaluate LLMs and RAG systems on long-context tasks, highlighting challenges and proposing a reproducible evaluation method for system performance.
https://arxiv.org/abs//2407.01370
YouTube: https://www.youtube.com/@ArxivPapers
TikTok: https://www.tiktok.com/@arxiv_papers
Apple Podcasts: https://podcasts.apple.com/us/podcast/arxiv-papers/id1692476016
Spotify: https://podcasters.spotify.com/pod/show/arxiv-papers
--- Support this podcast: https://podcasters.spotify.com/pod/show/arxiv-papers/support
1557 פרקים
همه قسمت ها
×ברוכים הבאים אל Player FM!
Player FM סורק את האינטרנט עבור פודקאסטים באיכות גבוהה בשבילכם כדי שתהנו מהם כרגע. זה יישום הפודקאסט הטוב ביותר והוא עובד על אנדרואיד, iPhone ואינטרנט. הירשמו לסנכרון מנויים במכשירים שונים.