Artwork

תוכן מסופק על ידי UCTV. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי UCTV או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.
Player FM - אפליקציית פודקאסט
התחל במצב לא מקוון עם האפליקציה Player FM !

AI Agents That Do What We Want

56:31
 
שתפו
 

Manage episode 390420853 series 2933222
תוכן מסופק על ידי UCTV. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי UCTV או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.
Researchers used to define objectives for artificial intelligence (AI) agents by hand, but with progress in optimization and reinforcement learning, it became obvious that it's too difficult to think of everything ahead of time and write it down. Instead, these days the objective is viewed as a hidden part of the state on which researchers can receive feedback or observations from humans — how they act and react, how they compare options, what they say. In this talk, Anca Dragan, Associate Professor of Electrical Engineering and Computer Sciences at UC Berkeley, discusses what this transition has achieved, what open challenges researchers still face and ideas for mitigating them. Dragan discusses applications in robotics and how the lessons there apply to virtual agents like large language models. Series: "Data Science Channel" [Science] [Show ID: 39350]
  continue reading

116 פרקים

Artwork
iconשתפו
 
Manage episode 390420853 series 2933222
תוכן מסופק על ידי UCTV. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי UCTV או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.
Researchers used to define objectives for artificial intelligence (AI) agents by hand, but with progress in optimization and reinforcement learning, it became obvious that it's too difficult to think of everything ahead of time and write it down. Instead, these days the objective is viewed as a hidden part of the state on which researchers can receive feedback or observations from humans — how they act and react, how they compare options, what they say. In this talk, Anca Dragan, Associate Professor of Electrical Engineering and Computer Sciences at UC Berkeley, discusses what this transition has achieved, what open challenges researchers still face and ideas for mitigating them. Dragan discusses applications in robotics and how the lessons there apply to virtual agents like large language models. Series: "Data Science Channel" [Science] [Show ID: 39350]
  continue reading

116 פרקים

כל הפרקים

×
 
Loading …

ברוכים הבאים אל Player FM!

Player FM סורק את האינטרנט עבור פודקאסטים באיכות גבוהה בשבילכם כדי שתהנו מהם כרגע. זה יישום הפודקאסט הטוב ביותר והוא עובד על אנדרואיד, iPhone ואינטרנט. הירשמו לסנכרון מנויים במכשירים שונים.

 

מדריך עזר מהיר