התחל במצב לא מקוון עם האפליקציה Player FM !
Safetywashing: Do AI Safety Benchmarks Actually Measure Safety Progress?
Manage episode 432190301 series 3524393
The paper analyzes AI safety benchmarks, revealing their correlation with general capabilities, and proposes a clearer framework for defining and measuring AI safety research goals.
https://arxiv.org/abs//2407.21792
YouTube: https://www.youtube.com/@ArxivPapers
TikTok: https://www.tiktok.com/@arxiv_papers
Apple Podcasts: https://podcasts.apple.com/us/podcast/arxiv-papers/id1692476016
Spotify: https://podcasters.spotify.com/pod/show/arxiv-papers
--- Support this podcast: https://podcasters.spotify.com/pod/show/arxiv-papers/support
1619 פרקים
Manage episode 432190301 series 3524393
The paper analyzes AI safety benchmarks, revealing their correlation with general capabilities, and proposes a clearer framework for defining and measuring AI safety research goals.
https://arxiv.org/abs//2407.21792
YouTube: https://www.youtube.com/@ArxivPapers
TikTok: https://www.tiktok.com/@arxiv_papers
Apple Podcasts: https://podcasts.apple.com/us/podcast/arxiv-papers/id1692476016
Spotify: https://podcasters.spotify.com/pod/show/arxiv-papers
--- Support this podcast: https://podcasters.spotify.com/pod/show/arxiv-papers/support
1619 פרקים
כל הפרקים
×ברוכים הבאים אל Player FM!
Player FM סורק את האינטרנט עבור פודקאסטים באיכות גבוהה בשבילכם כדי שתהנו מהם כרגע. זה יישום הפודקאסט הטוב ביותר והוא עובד על אנדרואיד, iPhone ואינטרנט. הירשמו לסנכרון מנויים במכשירים שונים.