Artwork

תוכן מסופק על ידי Nyedis. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי Nyedis או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.
Player FM - אפליקציית פודקאסט
התחל במצב לא מקוון עם האפליקציה Player FM !

Alignment Faking: The dark side of LLMs

23:48
 
שתפו
 

Manage episode 458305353 series 3463727
תוכן מסופק על ידי Nyedis. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי Nyedis או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.

Recently, Anthropic caught Claude faking alignment. This is going to create a brand new set of issues with AI that we previously did not see happening this quickly. We discuss where AI is headed and what new dangers this will pose.

You can read more about this here: https://www.reddit.com/r/singularity/comments/1hh7w9g/anthropic_caught_claude_faking_alignment_and/

And watch the panel from Anthropic covering this important topic: https://www.youtube.com/watch?v=9eXV64O2Xp8

For full video of this episode, head over to our Youtube channel at http://youtube.com/@nyedisiam

Follow us on your favorite platform for full episodes, shorts, and community feedback:

📺 Linkedin: https://www.linkedin.com/company/77611909/

🆇 X: https://x.com/nyedisiam

📷 Instagram: https://www.instagram.com/nyedisiam

🪩 TikTok: https://www.tiktok.com/@nyedisiam

Nyedis Website: https://www.Nyedis.com

  continue reading

238 פרקים

Artwork
iconשתפו
 
Manage episode 458305353 series 3463727
תוכן מסופק על ידי Nyedis. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי Nyedis או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.

Recently, Anthropic caught Claude faking alignment. This is going to create a brand new set of issues with AI that we previously did not see happening this quickly. We discuss where AI is headed and what new dangers this will pose.

You can read more about this here: https://www.reddit.com/r/singularity/comments/1hh7w9g/anthropic_caught_claude_faking_alignment_and/

And watch the panel from Anthropic covering this important topic: https://www.youtube.com/watch?v=9eXV64O2Xp8

For full video of this episode, head over to our Youtube channel at http://youtube.com/@nyedisiam

Follow us on your favorite platform for full episodes, shorts, and community feedback:

📺 Linkedin: https://www.linkedin.com/company/77611909/

🆇 X: https://x.com/nyedisiam

📷 Instagram: https://www.instagram.com/nyedisiam

🪩 TikTok: https://www.tiktok.com/@nyedisiam

Nyedis Website: https://www.Nyedis.com

  continue reading

238 פרקים

All episodes

×
 
Loading …

ברוכים הבאים אל Player FM!

Player FM סורק את האינטרנט עבור פודקאסטים באיכות גבוהה בשבילכם כדי שתהנו מהם כרגע. זה יישום הפודקאסט הטוב ביותר והוא עובד על אנדרואיד, iPhone ואינטרנט. הירשמו לסנכרון מנויים במכשירים שונים.

 

מדריך עזר מהיר

האזן לתוכנית הזו בזמן שאתה חוקר
הפעלה