תמיר נווה, אורי גורן ומייק ארליכסון מארחים מומחים מעולם הבינה המלאכותית. האזינו לשיחות עם חוקרי AI, דאטה סיינטסים, מהנדסי ML ומובילים בתעשייה, שמביאים לכם את האתגרים, המחשבות והתובנות המעניינות ביותר מבפנים.
…
continue reading
פרק שני בסדרת ״מושג בקצרה עם מייק״ בה נצלול לעומקם של מושגים מעולמות הML וAI. בכל פרק נתמקד במושג אחד מרכזי – נסביר אותו בפשטות, נדון במשמעויותיו המעשיות, ונבחן את השפעתו על התחום והתעשייה.על ידי Tamir Nave & Uri Goren
…
continue reading
1
חיזוי קונפורמי: מבט מעמיק עם חילף חסון
25:33
25:33
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
25:33
בעקבות הפרק שיפור וודאות במודלים: הצצה לעולם של ניבוי קונפורמי החלטנו הפעם לצלול עמוק פנימה. בפרק הזה, אנחנו צוללים לעומק עולם הניבוי הקונפורמי. יחד עם חילף חסון, נדון כיצד ניתן ליישם ניבוי קונפורמי בבעיות קלאסיפיקציה, מה היתרונות, ואיך זה לסייע בקבלת החלטות מדויקות יותר בעולם הנתונים. פרק עשיר בתובנות לכל חובבי ה-AI והדאטה סיינס האתר של חילף Confo…
…
continue reading
1
פרומפטים חכמים: מהפכת DSPy עם סרג' סמורדינסקי
25:36
25:36
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
25:36
היום בפרק נדבר עם סרג' סמורדינסקי, ראש תחום NLP ומחקר ב-Loris AI, לשיחה על חלופות להנדסת פרומפטים וכלי DSPy. סרג' ישתף על האתגרים בעבודה עם מודלים לשוניים גדולים (LLMs) וכיצד DSPy מאפשר יצירת פרומפטים דינמיים ואופטימליים. נציע מבט חדשני על עתיד ה-NLP ושיטות עבודה מתקדמות בתעשייה. לינקדאין של סרג׳ DSPy: Machine Learning Attitude Towards LLM Promptin…
…
continue reading
1
סיכום שנה - שנת 2025, השנה בה אייג׳נטים הולכים למות
25:59
25:59
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
25:59
ברוכים הבאים לפרק סיכום שנת 2024! הפעם שוחחנו עם איתן צימרמן, מוביל צוות הדאטא סייאנס ב-ARGMAX, סיכמנו את שנת 2024 ועל המגמות, האתגרים וטרנדים שנתקלנו בהם לאורך השנה בנוסף, שיתפנו את התחזיות שלנו לשנת 2025 – אילו טרנדים חדשים צפויים לצבור תאוצה? אילו בעיות טכנולוגיות נצטרך לפתור? מה אתם צופים ששנת 2025 תביא איתה בעולמות הML? לינקדאין של איתן…
…
continue reading
1
בין אקדמיה לתעשייה: עם אבי קצ׳ולרו ואמיר דוד ניסן כהן NLP
47:48
47:48
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
47:48
היום בפרק נצלול לעומק עולמות האקדמיה בתחום הNLP אבי ואמיר, חוקרים ומומחים בעולמות ה-NLP, משתפים במסלולי הקריירה שלהם, ההבדלים בין מחקר באקדמיה לעבודה בתעשייה, וכיצד ניתן למנף דוקטורט לקריירה מצליחה. נדון גם בשאלה מה הופך מחקר אקדמי למעניין, אילו כישורים ניתן לפתח בתהליך הדוקטורט, ומהם ההבדלים בין מחקר לתעשייה בעידן של LLMs האתר של אבי לינקדאין של א…
…
continue reading
1
פיזיקה, סדרות זמן, ולמידת מכונה: עם הדר שרביט
33:02
33:02
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
33:02
בפרק הבא נחקור יחד עם הדר שרביט את השילוב בין פיזיקה ללמידת מכונה בחיזוי סדרות זמן. נדון בהבדלים בין חיזוי לניבוי בזמן אמת, באתגרים תעשייתיים, ובדרכים שבהן מודלים פיזיקליים ונתוני חיישנים משתלבים כדי ליצור פתרונות מתקדמים. לינקדאין של הדר Nixtla הבלוג של הדרעל ידי Tamir Nave & Uri Goren
…
continue reading
1
יצירת וידיאו מטקסט: האתגרים והמורכבויות עם לירון יצחקי אלרהנד
37:23
37:23
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
37:23
בפרק זה נדבר עם לירון יצחקי אלרהנד באתגרים הטכניים ביצירת וידאו באמצעות בינה מלאכותית. נדון בניהול זיכרון, שמירה על קוהרנטיות בין פריימים, והקשרים בין מודלי שפה ליצירת וידאו, ונציג גם פתרונות חדשניים להתמודדות עם תנועות מורכבות ושיפור עקביות ויזואליתעל ידי Tamir Nave & Uri Goren
…
continue reading
1
מושג בקצרה עם מייק: Training LLMs
13:51
13:51
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
13:51
פרק שני בסדרת ״מושג בקצרה עם מייק״ בה נצלול לעומקם של מושגים מעולמות הML וAI. בכל פרק נתמקד במושג אחד מרכזי – נסביר אותו בפשטות, נדון במשמעויותיו המעשיות, ונבחן את השפעתו על התחום והתעשייה.על ידי Tamir Nave & Uri Goren
…
continue reading
1
אימון מודלים בבינה מלאכותית עם בן בורן
30:12
30:12
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
30:12
בפרק זה נשוחח עם בן בורן, CTO של SwarmOne, על האתגרים בהכשרת מודלים בבינה מלאכותית. בן יסביר על עבודה עם GPU, שמירה על אבטחת מידע, וסקלת מודלים גדולים. הם ונדון גם בהשפעת LLM ובדרכים לייעל את תהליכי ההכשרה. SwarmOne הלינקדאין של בןעל ידי Tamir Nave & Uri Goren
…
continue reading
1
ראג, לאן מכאן? פרק משותף עם ״המחוללים״
35:29
35:29
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
35:29
פרק משותף עם הפודקאסט ״״המחוללים של דורון שדה ושקד זיכלינסקי והפעם, נדון בכל מה שקשור ל-RAG, והאם אכן מכאן תגיע הישועה לפתרון בעיית ההזיות של מודלי שפה? ״המחוללים״ האתר של דורון לינקדאין של שקדעל ידי Tamir Nave & Uri Goren
…
continue reading
1
סוכנים אוטונומיים עם עמית מנדלבאום
49:43
49:43
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
49:43
בפרק הבא נדבר עם עמית מנדלבאום על התפתחות סוכנים אוטונומיים תוך שימוש במודלים מתקדמים של ראיית מחשב ו-LLMs. נתייחס לאתגרים בשילוב יכולות היסק ושיקול דעת, ולבעיות שהיו בפרויקטים כמו AutoGPT. נציג את הצלחתה של חברת Anthropic בהבנה של פעולות ממסכי מחשב ונסביר כיצד טכנולוגיות אלו משפרות את ההתמודדות עם פעולות ממוחשבות בצורה קרובה להתנהגות אנושית. https…
…
continue reading
1
מושג בקצרה עם מייק: Encoder/Decoder
17:08
17:08
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
17:08
פרק ראשון בסדרת ״מושג בקצרה עם מייק״ בה נצלול לעומקם של מושגים מעולמות הML וAI. בכל פרק נתמקד במושג אחד מרכזי – נסביר אותו בפשטות, נדון במשמעויותיו המעשיות, ונבחן את השפעתו על התחום והתעשייה.על ידי Tamir Nave & Uri Goren
…
continue reading
1
כתיבה גנרטיבית מול אנושית: ניווט באזור האפור עם אביב קרן
46:59
46:59
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
46:59
בפרק הבא נדבר על העולם המורכב של זיהוי טקסט שנוצר על ידי בינה מלאכותית. נסקור את השימושים הנפוצים ב-ChatGPT, מהכתיבה ועד ליישומים אפורים כמו העתקות ובוטים. יחד עם אביב קרן, נדון בשיטות לזיהוי טקסט מג׳ונרט, השפעות על האקדמיה, שימושים בבינה מלאכותית לאימון מודלים, ונדבר גם על האתגרים האתיים והטכנולוגיים שמלווים את התחום. Semantic Scholar A Survey on …
…
continue reading
היום בפרק נעסוק בהבנת למידה ניגודית ובחקר ההתפתחות שלה בשנים האחרונות. נדבר על עקרונות הבסיסיים של למידת קונטרסט, כמו חיפוש דימויים דומים (חיוביים) ודימויים שונים (שליליים), על כך שלפעמים קשה להגדיר את הדימויים השונים בצורה חד משמעית, והצורך בהגדלת כמויות הדאטה כדי להשיג תוצאות טובות יותר. נזכיר את השיטות השונות שהתפתחו, כגון SimCLR ו-Moco, ונסביר …
…
continue reading
היום בפרק נדבר עם גל פרץ, מהפודקאסט "LangTalks" ומומחה בתחום הבינה המלאכותית. נשוחח על נושאים כמו התפתחות השימוש במודלים של בינה מלאכותית, תפקידם של כלי No-Code בעולם הטכנולוגי, ואיך בינה מלאכותית משפיעה על הגישה ההנדסית והמחקרית של פיתוח מערכות היום. נבחנן גם את האתגרים וההזדמנויות שהתחום מציב עבור אנשי מוצר, מהנדסים וחוקרים, ועל חשיבותם של כלי Pr…
…
continue reading
1
Policy Diffusion: המהפיכה הבאה? עם מייק ותמיר
48:27
48:27
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
48:27
בפרק זה דיברנו על מאמר פורץ דרך בתחום הרובוטיקה: Diffusion Policy: Visuomotor Policy Learning via Action Diffusion המאמר טוען לשיפור של 46.9% במשימות מוטוריות של רובוטים. הם מראים תוצאות על סימולציות ועל רובוטים פיסיים. פעולות כמו מזיגה, עירבוב, הנחת ספל והסביבה המפורסמת push-T. בגדול הם לקחו את מה שכבר סקרנו בעבר stable diffusion לעולם הרובוטיקה, …
…
continue reading
1
שיפור וודאות במודלים: הצצה לעולם של ניבוי קונפורמי
30:14
30:14
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
30:14
אחרת הטכניקות הקלאסיות (משנות ה80) שזוכה לאחרונה לפופולאריות מחודשת היא Conformal Prediction. ברוב משימות הניבוי, לא מספיק לחזות רק מה התוצאה הכי סבירה - אלא מה הן מגוון האפשרויות, ומה הסבירות. ניקח למשל רופא שצריך לאבחן מטופל על סמך הסימפטומים, תוצאת הדיאגנוזה שלו תגרור את הטיפול המתאים. לכל אבחנה מתוך סט האבחנות יש סיכוי, וייתכן שיידרשו בדיקות נו…
…
continue reading
1
GPT-o1: האם אנחנו קרובים להבנה אמיתית?
40:00
40:00
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
40:00
בפרק הבא נדבר על הגרסה החדשה GPT-4o1, שמבטיחה יכולות מתקדמות של הסקת מסקנות. מייק יסביר כיצד המודל מנסה להתמודד עם בעיות מורכבות שדורשות יכולת לוגית מרובה, ומעלה את השאלה האם המודל באמת מצליח להתמודד עם משימות הסקה מורכבות או שמא הוא "מגזים" בהערכותיו. נבדוק גם את ההבדלים בין גרסאות קודמות, כמו GPT-3 ו-GPT-4, ונבחן את האתגרים וההזדמנויות שהגרסה החד…
…
continue reading
1
Mechanistic Interpretability עם מייק ארליכסון
41:58
41:58
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
41:58
בפרק הבא, נצלול לנושא המורכב של מכניסטית אינטרפרטביליות (Mechanistic Interpretability) במודלים של שפה, וננסה לפשט את הדרך בה ניתן להבין מה מתרחש בתוך מודלים אלה. נסביר כיצד מודלים בשימוש רחב כמו טרנספורמרים ומבנים מתמטיים אחרים מנסים לפענח את מנגנוני השפה, אבל נדבר גם על הקושי להבין מה באמת קורה "מאחורי הקלעים" של רשתות נוירונים עמוקות. נבין את השי…
…
continue reading
1
להגדיר מחדש את החיפוש: חידושים ב - RAG עם ניר דיאמנט
33:11
33:11
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
33:11
בפרק הבא, נארח את ניר דיאמנט, יועץ בתחום הבינה המלאכותית הגנרטיבית (GenAI) שיספר לנו על המסע המקצועי שלו והתפתחויות חדשניות בתחום. ניר מצטרף אלינו בעקבות תרומתו המשמעותית לשיטות RAG (Retrieval-Augmented Generation) כולל פיתוחים כמו GenAI Agents ו-Controlable RAG, שזכו להכרה רחבה ואף פורסמו על ידי מנכ״ל LangChain, האריסון צ׳ייס, כתכנים הפופולריים בי…
…
continue reading
1
מדע הנתונים – איך הוא השתנה לאורך השנים עם דניאל אהרונוביץ'
39:59
39:59
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
39:59
בפרק הזה דניאל ארונוביץ', מדען נתונים ותיק, מספר על המסע האישי שלו בתעשיית הטכנולוגיה לאורך 15 שנים. ניגע בהבדלים הבולטים בין העבר להווה, בכלים שהשתמשו בעבר לעומת הכלים שמשתמשים בהם היום שמחברים את המדע ישר לפרודקשן. דניאל מתאר את השינויים במיומנויות הנדרשות ממדעני נתונים, מיכולת ניתוח בלבד להכרח להבין תהליכי פיתוח וניהול גרסאות. נשוחח על האתגרים ה…
…
continue reading
החודש גוגל פרסמו את NotebookLM, שירות AI שמייצר שיחת עומק מוקלטת בין שני דוברים לא אמיתיים.כדי לבדוק את העניין, העלנו תמלול של "רק לא RAG" פרק הטיפים של אורי גורן מארגמקס על נסיונו עם ארכיטקטורת הRAG.והתוצאה, הפילה אותנו מהרגליים. נשמח לשמוע מה דעתכם? האם אפשר למכור את המיקרופון והציוד הקלטה ביד2?על ידי Tamir Nave & Uri Goren
…
continue reading
1
Data Science בעולם הביטוח עם דוד שוקרון
28:54
28:54
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
28:54
בפרק הזה, דוד שוקרון, Head of DS & AI בביטוח ישיר, מספק הצצה לעולם מדעי הנתונים בתעשיית הביטוח. נשמע ממנו על ההבדלים בין אקטואריה ל-Data Science, ועל איך משלבים DS במערכות ותיקות של חברות ביטוח דוד יסביר על יישומי DS בתעשייה עתירת נתונים כמו ביטוח, בשימוש בכלים ומודלים שונים, כולל השאלה אם יש צורך בכלים ייחודיים או שניתן להסתפק במוצרי מדף קיימים. ב…
…
continue reading
1
LLM לייעוץ השקעות עם אלעד נחמיאס
28:50
28:50
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
28:50
בפרק זה, אנחנו נשוחח עם אלעד נחמיאס CTO של Bridgewise, על השימוש במודלי שפה גדולים (LLMs) בתחום ההשקעות. אלעד יסביר לנו איך משלבים טכנולוגיות מתקדמות כדי לשפר תהליכי הייעוץ והאנליזה, תוך התמודדות עם אתגרים כמו דיוק הנתונים, הטיות פוטנציאליות ושמירה על פרטיות המידע. נשמע על האתגרים הטכניים והאתיים של יישום LLMs, איך Bridgewise מוודאת שהפתרונות שלה נ…
…
continue reading
1
Adaptive-RAG עם לירון יצחקי אלרהנד
30:35
30:35
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
30:35
בפרק הזה, נצלול יחד עם לירון יצחקי אלרהנד ל Interleaving Retrieval with Chain of Thought (IRCoT) שיטה לשיפור מערכות שאלה ותשובה על ידי הרחבה איטרטיבית של תהליך חשיבה ואחזור מידע רלוונטי. נדבר על טכניקות שונות של אחזור אדפטיבי, נשווה את יעילותן על סמך מורכבות השאלה, ונדגיש את החשיבות של בחירת הגישה הנכונה לתרחישים שונים המלצות של לירון למי שמועניין …
…
continue reading
1
Task Aware Embedding עם ענבל חורב
18:30
18:30
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
18:30
לא רק היופי הוא בעיניי המתבונן, מסתבר שגם הדימיון הסמנטי בפרק הזה ענבל תספר לנו איך התגלגלה מטוקיו ל בגונג senior staff researcher כשחושבים על אמבדינגז, הרבה פעמים חושבים על חיפוש וקטורי ו RAG נדבר על החשיבות של אמבדינג טוב דווקא בשלב הכרת הדאטא ובחירת דוגמאות מעניינות לאימון. נסקור את ההיסטוריה של אמבדינג, ללא הקשר, עם הקשר, ועד Task aware embeddi…
…
continue reading
1
מלימודים הומניסטים למדעי הנתונים - פרק בשיתוף עם YData
28:54
28:54
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
28:54
בפרק זה ריאיינו את אורי גוטליב ונטע בר על המעבר שלהם לעולם ה data science במסגרת ההכשרה שלהם ב YData.על הפער העצום בין התאוריה לעבודה מעשית ועל הפרויקט שעשו שהביא אותם לעבודה הנוכחית שלהם. קישורים: אורי גוטליב נטע בר wids il facebook Wids-linkdin קהילת באותעל ידי Tamir Nave & Uri Goren
…
continue reading
1
בינה מלאכותית וצ'יפים - עם ד"ר אמיתי ערמון
37:06
37:06
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
37:06
אינטל העולמית נמצאת השבוע בכותרות בעקבות ההצהרה על הצמצומים, וזו הזדמנות מעולה להזכיר על הפעילות המדהימה של קבוצת הדאטא סיינס של אינטל ישראל. החודש פורסם כי הקבוצה AI Solutions Group זכתה בפרס הארגון המצטיין העולמי של אינטל. בפרק זה ד"ר אמיתי ערמון יספר לנו על התפקיד שלו בתור ה Chief Data Scientist של הקבוצה, מה היא עושה? מה האתגרים היחודיים שלהם? …
…
continue reading
1
על מודלים פתוחים, רשיונות ורגולציה עם עופר חרמוני
30:17
30:17
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
30:17
קוד פתוח זה נושא מורכב, יש כמה סוגים של רשיונות כמו GPL, Apache, MIT וכו׳.העניינים מסתבכים עוד יותר כשמדברים על מודלים פתוחים, האם קוד המודל פתוח? אולי רק המאמר? אולי רק המשקולות פתוחות? ומה לגבי הדאטא?בפרק זה עופר חרמוני, יועץ בתחום הAI וחבר בLinux foundationיספר על הקריטריונים של הארגון למודלים פתוחים, ונמנה מספר מודלים כאלו. עולם הAI מתקדם בקצב …
…
continue reading
גיא אדלר מחברת אקסיליון יחלוק איתנו מנסיונו בפיתוח ושימוש במערכות סימולציה לעולם התחבורה.אקסיליון מפתחת מוצר לעיריות לצורך אופטימיזציה של רמזורים ותנועה, כדי שכולנו נבלה כמה שפחות זמן בפקקים. נדבר על האתגרים בתחזית של אירועים נדירים כגון מזג אוויר, הופעות, ושיבושי תנועה.ועל החשיבות של עבודה משותפת עם מומחי תוכן ואינטגרציה עם מערכות אמיתיות של עיריו…
…
continue reading
1
ניסויים מדעיים באמצעות סימולציות - עם רותם רוזנבלום
33:50
33:50
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
33:50
פרק פיצוץ על איך סימולציות יכולות לעזור לנו לחזות תגובה של חומרי נפץ במתחים שונים.בפרק זה רותם תספר לנו על המחקר האקדמי שלה בשיתוף עם רפאל, ועל איך סימולציות עזרו לחסוך המון כסף וזמן על ניסוי שטח.נדבר על ההבדלים בין סימולציות סדרתיות, ובין סימולציות אגרגטיביות.ומדוע סימולציות הם הכלי הנכון לבדוק את המודל שלנו בכל מיני מקרי קצה נדירים, או שטרם קרו. …
…
continue reading
1
על ההיסטוריה של סימולציות עם יניב טננבאום קטן
30:36
30:36
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
30:36
סימולציות היו פעם כלי הניבוי המרכזי, והיום הוחלפו על ידי מודלי למידת מכונה.האם מדובר בכלי מיושן ולא רלוונטי, או באומנות עתיקה שנשכחה.בפרק זה נדבר על המוטיבציות לסימולציות אל מול הרצת ניסויים על דאטא אמיתי, ונדבר על החוזקות והחולשות מול מודלי למידת מכונה. קורס חינמי של אוניברסיטת חיפה על סימולציותעל ידי Tamir Nave & Uri Goren
…
continue reading
1
המלצות, סימולציות, שינוי העדפות ודילמות טווח ארוך - טווח קצר - עם פרופ׳ עומר בן פורת
40:11
40:11
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
40:11
מערכות המלצה נתפסות לרוב כבעיית רגרסיה או קלאסיפיקציה, בפרק זה פרופסור עומר בן פורת מהטכניון ואורי ינהלו דיון טכני על האתגרים במידול סטטי כזה.נדבר על יצירת העדפות, ועל האחריות המשפטית של מערכת ההמלצה.מערכת המלצה אמורה למדל אנשים, ואנשים הם לא יצור רציונאלי או עקבי - כיצד מערכת ההמלצה אמורה להתמודד עם זה? ונדבר על החשיבות של סימולציה למדידה ואימון מ…
…
continue reading
1
Consistency Large Language Models עם מייק ארליכסון
29:12
29:12
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
29:12
למודלי שפה (גדולים) יש שלושה תת-מודלים: הטוקנייזר, הטרנספורמר, ואלגוריתם הפענוח. אלגוריתם הפיענוח בדרך כלל אינו נלמד, אלא הוא איזה שהיא יוריסטיקה סדרתית של חיפוש בעץ על סמך ההסתברויות של הטרנספורמר.אבל מי מבטיח שהיוריסטיקה הזו היא הדבר האידיאלי לעשות בהנתן הפלט של הטרנספורמר.Consistency LLMs מנסים לקשור את שתי הקצוות, ולהתאים את ההטרנספורמר לאלגורי…
…
continue reading
1
Predictive mean matching and imputation - השלמת ערכים חסרים איטרטיבית
8:28
8:28
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
8:28
ערכים חסרים הם נחלתו של כל מי שעוסק בעיבוד מידע טבלאי, הפעם נתמקד בהשלמת ערכים רציפים עם Predictive mean matching.אחת השיטות הנפוצות MICE, לא היתה זמינה עד לאחרונה למשתמש פייתון - וכעת נמצאת במודול הexperimental של scikit learn. נעשה סקירה קצרה על מתי כדאי להשלים ערכים חסרים ומתי לא, ונדבר על השיטות הנפוצות להשלמה.…
…
continue reading
הרבה מאיתנו שמעו בכותרות על KAN פה, KAN שם - ולא היה ברור מה המהומה. Kolmogorov Arnold network זו ארכיטקטורה שמאיימת לשנות את איך שאנחנו חושבים על רשתות נוירונים, החל במבנה של נוירון ועד יכולת ההסבר.בנוסף, לרשתות כאן יש פי עשר פחות פרמטרים והן דלילות יותר - נשמע מדהים.אבל, הפוטנציאל הוא גדול אבל המציאות היא בפרטים הקטנים - אותם נכסה בפרק הזה…
…
continue reading
מי לא שמע על RAG, נראה שכולם מדברים, מממשים ומאפטמים ראגים לכל שימוש.בפרק זה אורי שוטח את משנתו על ראגים, וטוען שהם בשימוש יתר בתעשייה (יש יגידו הייפ), ואלו הן הסיבות1. אתם אחראיים (משפטית) על הפלט שלהם - אם אין בן אדם בלופ - יש בעיה2. שאילתות סמנטיות לא מתאימות להמון מקרים, חיפוש וקטורי הוא לא התשובה לretrieval3. זה נראה כאילו חיפוש וקטורי נועד לח…
…
continue reading
מירב גרימברג עוסקת למחייתה בפיתוח מנוע החיפוש הוקטורי של רדיס, הגיעה לספר לנו תובנות מבפנים.לאחרונה רואים שיותר ויותר דאטאבייסים ״מסורתיים״ מוסיפים פונקציונאליות של חיפוש וקטורי, רדיס הוא אחד מהם. רדיס, הוא היום שירות ברירת המחדל לחיפוש key-value מהיר בזמן אמת. וגם מנוע חיפוש וקטורי המממש את אלגוריתם הhnsw לחיפוש וקטורי מקורב. מירב תספר לנו על האיל…
…
continue reading
עכשיו כשהעולם רועש סביב מודלי שפה גדולים וחזקים שאינם טרנספורמרים (מאמבה, rwkv) - הגיע הזמן להיזכר מה הוא הטרנספורמר ומה היו המוטיבציות ליצירתו. פרק זה הינו שידור חוזר של פרק מ2020, האזנה מרתקת לאזניים של 2024.על ידי Tamir Nave & Uri Goren
…
continue reading
1
כישורים רכים למדעני נתונים - עם בוריס גורליק
24:30
24:30
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
24:30
בוריס גורליק, יועץ דאטא מנוסה עם רקע ניכר בדאטא טבלאי, ויזואליזציה וסדרות זמן - ידבר איתנו על דווקא על נושא אחר: Soft skills.מדעני נתונים, הם לא רק אנשים טכניים שיודעים להריץ פייתון ולאפטם מודלים - הכוונה ב״כישורים רכים״ זה לכל יכולת התקשורת בארגון ובצוות, ובעבודה במשותף כחלק מאתגר גדול יותר. נדבר על אתגרים נפוצים בחיי הDS ועל איך נכון לבנות מצגת ב…
…
continue reading
1
על למידה מונחית עצמית עם מייק ארליכסון Self Supervised
50:40
50:40
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
50:40
בפרק זה אירחנו את מיכאל ארליכסון לדבר על self supervised learning. דיברנו על בעיית דלילות הסיגנל, ועלות התיוג. למידה self supervised מתמקדת בלמידת היצוג הוקטורי על ידי משימות שלא דורשות תיוג. לדוגמא, אם לקחנו תמונה ו הרעשנו אותה (או סיבוב, שיקוף, זום) נצפה שוקטור היצוג יהיה דומה. דיברנו על טכניקות שונות ללמידת יצוגים, כגון רשתות סיאמיות, למידה ניגו…
…
continue reading
1
על פרטיות דיפרנציאלית עם משה שנפלד
33:20
33:20
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
33:20
יש הרבה עיסוק בסכנות הכרוכות בהדלפה של פרטים מזהים בדאטאסטים או בתוך משקולות של מודלים מאומנים. בפרק זה משה שנפלד, חוקר בתחום, יספר לנו כמה זה מורכב להפוך דאטאסט אנונימי ונדבר על כמה פדיחות שקרו בתחום. נדבר על האתגרים של אימון מודלים בצורה פרטית, והאם מדובר בסוג חדש של רגולרזיציה. נכסה אלגוריתמים כמו k-annonimity ונדבר על Differential privacy שהיא …
…
continue reading
1
איך ללמד מודל שפה לדבר כמו ערס עם חן מרגלית מ LSports
27:53
27:53
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
27:53
בפרק זה חן מרגלית סיפר על פיתוח SEC by LSportsהבוט שמתמצת ועונה על שאלות על משחקי ספורט. הבעיה העיקרית היא שרוב מודלי השפה אומנו על ויקיפדיה, כתבות ואתרי שאלות ותשובות - ולא שפה השגורה במגרשי הכדורגל. חן יספר על התהליך של יצירת הדאטא, פיינטון וכמובן שרשרת המודלים ליצירת התחזיות שקדמה למענה של הצ׳טבוט.…
…
continue reading
1
AlgoGen - שילוב של אלגוריתמים ומודלי שפה גנרטיביים, עם אמיר שחר
28:11
28:11
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
28:11
בפרק זה אמיר שחר יספר על שיטה חדשנית שפרסם לשילוב מודלי שפה יחד עם אלגוריתמים. לפני 20 שנים, כנראה שאם הייתם אומרים AI הייתם מתכוונים לאלגוריתמי חיפוש בעצים. אלגוריתמי חיפוש כמו A Star מנצחים מסטרים בשח מט, ואפילו עוזרים לנו להתמצא בעיר עם Waze. למעשה, אם מסתכלים עמוק בתוך LLM מגלים גם בו שימושים באלגוריתמי חיפוש. אמיר יספר מנסיונו איך אפשר לשפר אל…
…
continue reading
1
מערכות המלצה כמשק כלכלי - עם ד״ר עומר בן פורת
24:08
24:08
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
24:08
נהוג להסתכל על מערכת המלצה כאל בעיית אופטימיזציה, איזה סרטון לנגן כך שיהיו הכי הרבה צפיות בהתחשב בהיסטוריית הלקוח.אבל אם לוקחים צעד אחורה, מגלים שאנחנו בשוק מסחר תלת צדדי. לסרטונים יש יוצרים, ולפלטפורמה יש בעלי מניות, וכמובן - אנחנו הצופים. כמובן שאם הפלטפורמה לא תהיה רווחית, תהיה בעיה בטווח המיידי - אבל גם אם יוצרי התוכן לא יזכו לחשיפה הם ינטשו את…
…
continue reading
רשתות נוירונים על שלל סוגיהן זוכות להרבה אטנשן - אבל בפועל, הרבה פרויקטים לא זקוקים לרשתות נוירונים.מודליים עציים הם בדרך כלל הפתרון הפשוט והיעיל לדאטא טבלאי.בפרק קצרצר זה, נסקור את עצי החלטה, תהליך אימונם ובעיית הOverfit.נדבר על שתי ההרחבות הנפוצות:Random Forest & Gradient Boosted Trees והיתרונות שיש בשימוש במודלים ותיקים בסביבת פרודקשן…
…
continue reading
1
אימות פורמלי של רשתות נוירונים עם איתי בוחניק וד״ר גיא אמיר
31:06
31:06
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
31:06
נדירים המקרים בהם שני תחומים כ״כ רחוקים במדעי המחשב נפגשים, ועוד זוכים להגיע לפרודקשן. אימות פורמלי הוא תחום העוסק בוידוא מתמטי שתוכנית אמורה לרוץ בלי תקלות, והוכחה שהתוכנית מקיימת תכונות מסוימות. בדרך כלל רואים אימות פורמלי בתחומים כמו קומפילציה או לוגיקה, ולכן היה מרתק לשמוע איך שיטות תאורטיות כאלו מצאו את עצמן בישום אצל חברת אלביט המפתחת רשתות נ…
…
continue reading
1
Mamba סיכום מנהלים ותחזיות לעתיד,עם מייק ארליכסון
45:12
45:12
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
45:12
עולם מודלי השפה מושתת על ארכיטקטורת הטרנספורמר שמכילה בעיה מובנית בתוכה - סיבוכיות ריבועית בקלט, ולאחרונה אלטרנטיבות מעניינות לטרנספורמר הגיחו לחיינו. פרק זה הינו פרק שני בסדרה, והוא סיכום מנהלים על עקרון הדואליות, מוטיבציה ותחזיות להמשך. מייק ואני נדבר על איך דואליות משפיעה על אימון יעיל והוזלה של עלויות, על ארכיטקטורות חומרה והתאמתן לטרנספורמרים.…
…
continue reading
1
Mamba סקירה טכנית עם מייק ארליכסון
49:30
49:30
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
49:30
יש הרבה התרחשויות סביב ארכיטקטורות חדשות (שאינן טרנספורמר) שיכולות להיות המנוע מאחורי הLLM הבא. פרק זה הינו פרק ראשון מתוך שניים, על Mamba ו State Space Models שנראים אלטרנטיבה מבטיחה. נצלול טכנית למוטיבציה ולאלגוריתמים המתמטיים, ואיך פולינומי לג׳נדר קשורים לעניין. הפרק טיפה טכני מהרגיל, בפרק הבא נעלה רמה ונסקור את ההשלכות ותחזיות לדעתנו.…
…
continue reading
1
עולם ללא עוגיות - פרק הפוך עם דין פלבן
33:54
33:54
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
33:54
פרק משותף עם דין פלבן מ The MLOps Podcastעל הנושא שמעסיק את עולם הפרסום היום. ברוח חקיקה אירופאית ואמריקאית, נהיה קשה יותר ויותר מבחינה חוקית לעקוב אחרי התנהגות משתמשים עם קוקיז (עוגיות).לשמירה על הפרטיות יש גם צד שנוגע לנו, אנשי הדאטא בכל הקשור למדידת איכות אלגוריתמים ולמידה. בפרק זה דין ייארח את אורי ונדון על מה אפשר לעשות.…
…
continue reading