התחל במצב לא מקוון עם האפליקציה Player FM !
[QA] Summary of a Haystack: A Challenge to Long-Context LLMs and RAG Systems
Manage episode 427311109 series 3524393
SummHay introduces a task to evaluate LLMs and RAG systems on long-context tasks, highlighting challenges and proposing a reproducible evaluation method for system performance.
https://arxiv.org/abs//2407.01370
YouTube: https://www.youtube.com/@ArxivPapers
TikTok: https://www.tiktok.com/@arxiv_papers
Apple Podcasts: https://podcasts.apple.com/us/podcast/arxiv-papers/id1692476016
Spotify: https://podcasters.spotify.com/pod/show/arxiv-papers
--- Support this podcast: https://podcasters.spotify.com/pod/show/arxiv-papers/support
1260 פרקים
Manage episode 427311109 series 3524393
SummHay introduces a task to evaluate LLMs and RAG systems on long-context tasks, highlighting challenges and proposing a reproducible evaluation method for system performance.
https://arxiv.org/abs//2407.01370
YouTube: https://www.youtube.com/@ArxivPapers
TikTok: https://www.tiktok.com/@arxiv_papers
Apple Podcasts: https://podcasts.apple.com/us/podcast/arxiv-papers/id1692476016
Spotify: https://podcasters.spotify.com/pod/show/arxiv-papers
--- Support this podcast: https://podcasters.spotify.com/pod/show/arxiv-papers/support
1260 פרקים
All episodes
×ברוכים הבאים אל Player FM!
Player FM סורק את האינטרנט עבור פודקאסטים באיכות גבוהה בשבילכם כדי שתהנו מהם כרגע. זה יישום הפודקאסט הטוב ביותר והוא עובד על אנדרואיד, iPhone ואינטרנט. הירשמו לסנכרון מנויים במכשירים שונים.