Artwork

תוכן מסופק על ידי Today, Explained AI and Explained AI. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי Today, Explained AI and Explained AI או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.
Player FM - אפליקציית פודקאסט
התחל במצב לא מקוון עם האפליקציה Player FM !

Researchers Expose "Adversarial Poetry" AI Jailbreak Flaw

5:24
 
שתפו
 

Manage episode 521724376 series 3679807
תוכן מסופק על ידי Today, Explained AI and Explained AI. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי Today, Explained AI and Explained AI או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.

In this episode, we break down new research revealing how "adversarial poetry" prompts can slip past safety filters in major AI chatbots to unlock instructions for nuclear weapons, cyberattacks, and other dangerous acts. We explore why poetic language confuses current guardrails, what this means for AI security, and how regulators and platforms might respond to this emerging threat.

Get the top 40+ AI Models for $20 at AI Box: ⁠⁠https://aibox.ai

See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.

  continue reading

446 פרקים

Artwork
iconשתפו
 
Manage episode 521724376 series 3679807
תוכן מסופק על ידי Today, Explained AI and Explained AI. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי Today, Explained AI and Explained AI או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.

In this episode, we break down new research revealing how "adversarial poetry" prompts can slip past safety filters in major AI chatbots to unlock instructions for nuclear weapons, cyberattacks, and other dangerous acts. We explore why poetic language confuses current guardrails, what this means for AI security, and how regulators and platforms might respond to this emerging threat.

Get the top 40+ AI Models for $20 at AI Box: ⁠⁠https://aibox.ai

See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.

  continue reading

446 פרקים

כל הפרקים

×
 
Loading …

ברוכים הבאים אל Player FM!

Player FM סורק את האינטרנט עבור פודקאסטים באיכות גבוהה בשבילכם כדי שתהנו מהם כרגע. זה יישום הפודקאסט הטוב ביותר והוא עובד על אנדרואיד, iPhone ואינטרנט. הירשמו לסנכרון מנויים במכשירים שונים.

 

מדריך עזר מהיר

האזן לתוכנית הזו בזמן שאתה חוקר
הפעלה