תמיר נווה, אורי גורן ומייק ארליכסון מארחים מומחים מעולם הבינה המלאכותית. האזינו לשיחות עם חוקרי AI, דאטה סיינטסים, מהנדסי ML ומובילים בתעשייה, שמביאים לכם את האתגרים, המחשבות והתובנות המעניינות ביותר מבפנים.
…
continue reading
![Artwork](/static/images/128pixel.png)
1
בין תחרות למציאות: הצצה לתחרויות Kaggle עם דן עופר
39:46
39:46
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
39:46בפרק זה, אירחנו את דן עופר, מדען נתונים בכיר ב-Medtronic ודוקטורנט באוניברסיטה העברית, נדבר על ניסיונו בתחרויות Kaggle ובתחום מדעי הנתונים. נדון גם בתרומתה של Kaggle לפיתוח יכולות מעשיות, באתגרים שבין התחרויות לבין המציאות המקצועית, ובתובנות שנרכשו מתחרות ProteinBERT לאנליזת חלבונים באמצעות מודלים מבוססי שפה. גיטהאב של דן לינקדאין של דן…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
בינה מלאכותית בגובה העיניים עם בר שאלתיאל
36:19
36:19
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
36:19בר שאלתיאל מוביל את קהילת בינה מלאכותית בגובה העיניים המונה מעל 30000 אנשים. בר שיצא בשאלה מהעולם החרדי לפני כשלוש שנים גילה כמעט בטעות את כוחם של מודלי השפה הגדולים כשהתחיל לסייע לסטודנטים לכתוב עבודות אקדמיות. מאז נכנס בר למסע של מחקר והבנה איך המנגנון עובד, ואילו פרומפטים יעילים ביותר. יוצא לנו הרבה לדבר על מודלי שפה גדולים מנקודת המבט של החוקר,…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
בואו לפגוש אותנו בפרק לייב ראשון - Ask us anything
0:50
0:50
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
0:50כבר חמש שנים שאנחנו מקליטים על למידת מכונה, אלגוריתמים ולא מעט על GenAI. עוד אף פעם לא מאוחר להזמין לפרק לייב, בשיתוף פעולה עם qodo לפרק מיוחד של Ask me anything/ כדי שנוכל להתכונן, נשמח לענות על השאלות שלכם בקישור הבא: https://docs.google.com/forms/d/e/1FAIpQLSeqQX4VtEoGxa4IlEi4-cpn46mtkhOdogR4FTxNwuq8cXy2HA/…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
DeepSeek - הצצה פנימה - איך הוא עובד
43:34
43:34
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
43:34כולם מדברים על דיפסיק, המודל הסיני, החדש, הזול והאופן סורס שמביס את צ׳אט ג׳י פי טי ומביך את OpenAIבפרק זה נדבר על ארבעת החידושים הטכנולוגיים מהמאמר: GRPO, KL-divergence approximation, multi token prediction והקוואנטיזציה.ואיך לא, גם קצת השערות של מייק ארליכסון ושל אורי גורן על מה באמת קורה מתחת למכסה המנוע.…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
דאטה טאבולרי במחקר עם פרופ׳ אופיר לינדנבאום
25:19
25:19
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
25:19בפרק זה מצטרף אלינו פרופ' אופיר לינדנבאום מאוניברסיטת בר-אילן לשיחה על השימוש בלמידת עומק לגילוי מדעי. נדון באתגרים הייחודיים של נתונים טבלאיים, היתרונות של רשתות נוירונים מול שיטות מסורתיות, ויישומים מעשיים בתחומים כמו ביולוגיה ורפואה. המאמר שהזכרנו בפרק האתר של אופיר לינקדאין של אופירעל ידי Tamir Nave & Uri Goren
…
continue reading
פרק שני בסדרת ״מושג בקצרה עם מייק״ בה נצלול לעומקם של מושגים מעולמות הML וAI. בכל פרק נתמקד במושג אחד מרכזי – נסביר אותו בפשטות, נדון במשמעויותיו המעשיות, ונבחן את השפעתו על התחום והתעשייה.על ידי Tamir Nave & Uri Goren
…
continue reading
![Artwork](/static/images/128pixel.png)
1
חיזוי קונפורמי: מבט מעמיק עם חילף חסון
25:33
25:33
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
25:33בעקבות הפרק שיפור וודאות במודלים: הצצה לעולם של ניבוי קונפורמי החלטנו הפעם לצלול עמוק פנימה. בפרק הזה, אנחנו צוללים לעומק עולם הניבוי הקונפורמי. יחד עם חילף חסון, נדון כיצד ניתן ליישם ניבוי קונפורמי בבעיות קלאסיפיקציה, מה היתרונות, ואיך זה לסייע בקבלת החלטות מדויקות יותר בעולם הנתונים. פרק עשיר בתובנות לכל חובבי ה-AI והדאטה סיינס האתר של חילף Confo…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
פרומפטים חכמים: מהפכת DSPy עם סרג' סמורדינסקי
25:36
25:36
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
25:36היום בפרק נדבר עם סרג' סמורדינסקי, ראש תחום NLP ומחקר ב-Loris AI, לשיחה על חלופות להנדסת פרומפטים וכלי DSPy. סרג' ישתף על האתגרים בעבודה עם מודלים לשוניים גדולים (LLMs) וכיצד DSPy מאפשר יצירת פרומפטים דינמיים ואופטימליים. נציע מבט חדשני על עתיד ה-NLP ושיטות עבודה מתקדמות בתעשייה. לינקדאין של סרג׳ DSPy: Machine Learning Attitude Towards LLM Promptin…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
סיכום שנה - שנת 2025, השנה בה אייג׳נטים הולכים למות
25:59
25:59
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
25:59ברוכים הבאים לפרק סיכום שנת 2024! הפעם שוחחנו עם איתן צימרמן, מוביל צוות הדאטא סייאנס ב-ARGMAX, סיכמנו את שנת 2024 ועל המגמות, האתגרים וטרנדים שנתקלנו בהם לאורך השנה בנוסף, שיתפנו את התחזיות שלנו לשנת 2025 – אילו טרנדים חדשים צפויים לצבור תאוצה? אילו בעיות טכנולוגיות נצטרך לפתור? מה אתם צופים ששנת 2025 תביא איתה בעולמות הML? לינקדאין של איתן…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
בין אקדמיה לתעשייה: עם אבי קצ׳ולרו ואמיר דוד ניסן כהן NLP
47:48
47:48
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
47:48היום בפרק נצלול לעומק עולמות האקדמיה בתחום הNLP אבי ואמיר, חוקרים ומומחים בעולמות ה-NLP, משתפים במסלולי הקריירה שלהם, ההבדלים בין מחקר באקדמיה לעבודה בתעשייה, וכיצד ניתן למנף דוקטורט לקריירה מצליחה. נדון גם בשאלה מה הופך מחקר אקדמי למעניין, אילו כישורים ניתן לפתח בתהליך הדוקטורט, ומהם ההבדלים בין מחקר לתעשייה בעידן של LLMs האתר של אבי לינקדאין של א…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
פיזיקה, סדרות זמן, ולמידת מכונה: עם הדר שרביט
33:02
33:02
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
33:02בפרק הבא נחקור יחד עם הדר שרביט את השילוב בין פיזיקה ללמידת מכונה בחיזוי סדרות זמן. נדון בהבדלים בין חיזוי לניבוי בזמן אמת, באתגרים תעשייתיים, ובדרכים שבהן מודלים פיזיקליים ונתוני חיישנים משתלבים כדי ליצור פתרונות מתקדמים. לינקדאין של הדר Nixtla הבלוג של הדרעל ידי Tamir Nave & Uri Goren
…
continue reading
![Artwork](/static/images/128pixel.png)
1
יצירת וידיאו מטקסט: האתגרים והמורכבויות עם לירון יצחקי אלרהנד
37:23
37:23
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
37:23בפרק זה נדבר עם לירון יצחקי אלרהנד באתגרים הטכניים ביצירת וידאו באמצעות בינה מלאכותית. נדון בניהול זיכרון, שמירה על קוהרנטיות בין פריימים, והקשרים בין מודלי שפה ליצירת וידאו, ונציג גם פתרונות חדשניים להתמודדות עם תנועות מורכבות ושיפור עקביות ויזואליתעל ידי Tamir Nave & Uri Goren
…
continue reading
![Artwork](/static/images/128pixel.png)
1
מושג בקצרה עם מייק: Training LLMs
13:51
13:51
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
13:51פרק שני בסדרת ״מושג בקצרה עם מייק״ בה נצלול לעומקם של מושגים מעולמות הML וAI. בכל פרק נתמקד במושג אחד מרכזי – נסביר אותו בפשטות, נדון במשמעויותיו המעשיות, ונבחן את השפעתו על התחום והתעשייה.על ידי Tamir Nave & Uri Goren
…
continue reading
![Artwork](/static/images/128pixel.png)
1
אימון מודלים בבינה מלאכותית עם בן בורן
30:12
30:12
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
30:12בפרק זה נשוחח עם בן בורן, CTO של SwarmOne, על האתגרים בהכשרת מודלים בבינה מלאכותית. בן יסביר על עבודה עם GPU, שמירה על אבטחת מידע, וסקלת מודלים גדולים. הם ונדון גם בהשפעת LLM ובדרכים לייעל את תהליכי ההכשרה. SwarmOne הלינקדאין של בןעל ידי Tamir Nave & Uri Goren
…
continue reading
![Artwork](/static/images/128pixel.png)
1
ראג, לאן מכאן? פרק משותף עם ״המחוללים״
35:29
35:29
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
35:29פרק משותף עם הפודקאסט ״״המחוללים של דורון שדה ושקד זיכלינסקי והפעם, נדון בכל מה שקשור ל-RAG, והאם אכן מכאן תגיע הישועה לפתרון בעיית ההזיות של מודלי שפה? ״המחוללים״ האתר של דורון לינקדאין של שקדעל ידי Tamir Nave & Uri Goren
…
continue reading
![Artwork](/static/images/128pixel.png)
1
סוכנים אוטונומיים עם עמית מנדלבאום
49:43
49:43
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
49:43בפרק הבא נדבר עם עמית מנדלבאום על התפתחות סוכנים אוטונומיים תוך שימוש במודלים מתקדמים של ראיית מחשב ו-LLMs. נתייחס לאתגרים בשילוב יכולות היסק ושיקול דעת, ולבעיות שהיו בפרויקטים כמו AutoGPT. נציג את הצלחתה של חברת Anthropic בהבנה של פעולות ממסכי מחשב ונסביר כיצד טכנולוגיות אלו משפרות את ההתמודדות עם פעולות ממוחשבות בצורה קרובה להתנהגות אנושית. https…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
מושג בקצרה עם מייק: Encoder/Decoder
17:08
17:08
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
17:08פרק ראשון בסדרת ״מושג בקצרה עם מייק״ בה נצלול לעומקם של מושגים מעולמות הML וAI. בכל פרק נתמקד במושג אחד מרכזי – נסביר אותו בפשטות, נדון במשמעויותיו המעשיות, ונבחן את השפעתו על התחום והתעשייה.על ידי Tamir Nave & Uri Goren
…
continue reading
![Artwork](/static/images/128pixel.png)
1
כתיבה גנרטיבית מול אנושית: ניווט באזור האפור עם אביב קרן
46:59
46:59
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
46:59בפרק הבא נדבר על העולם המורכב של זיהוי טקסט שנוצר על ידי בינה מלאכותית. נסקור את השימושים הנפוצים ב-ChatGPT, מהכתיבה ועד ליישומים אפורים כמו העתקות ובוטים. יחד עם אביב קרן, נדון בשיטות לזיהוי טקסט מג׳ונרט, השפעות על האקדמיה, שימושים בבינה מלאכותית לאימון מודלים, ונדבר גם על האתגרים האתיים והטכנולוגיים שמלווים את התחום. Semantic Scholar A Survey on …
…
continue reading
היום בפרק נעסוק בהבנת למידה ניגודית ובחקר ההתפתחות שלה בשנים האחרונות. נדבר על עקרונות הבסיסיים של למידת קונטרסט, כמו חיפוש דימויים דומים (חיוביים) ודימויים שונים (שליליים), על כך שלפעמים קשה להגדיר את הדימויים השונים בצורה חד משמעית, והצורך בהגדלת כמויות הדאטה כדי להשיג תוצאות טובות יותר. נזכיר את השיטות השונות שהתפתחו, כגון SimCLR ו-Moco, ונסביר …
…
continue reading
היום בפרק נדבר עם גל פרץ, מהפודקאסט "LangTalks" ומומחה בתחום הבינה המלאכותית. נשוחח על נושאים כמו התפתחות השימוש במודלים של בינה מלאכותית, תפקידם של כלי No-Code בעולם הטכנולוגי, ואיך בינה מלאכותית משפיעה על הגישה ההנדסית והמחקרית של פיתוח מערכות היום. נבחנן גם את האתגרים וההזדמנויות שהתחום מציב עבור אנשי מוצר, מהנדסים וחוקרים, ועל חשיבותם של כלי Pr…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
Policy Diffusion: המהפיכה הבאה? עם מייק ותמיר
48:27
48:27
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
48:27בפרק זה דיברנו על מאמר פורץ דרך בתחום הרובוטיקה: Diffusion Policy: Visuomotor Policy Learning via Action Diffusion המאמר טוען לשיפור של 46.9% במשימות מוטוריות של רובוטים. הם מראים תוצאות על סימולציות ועל רובוטים פיסיים. פעולות כמו מזיגה, עירבוב, הנחת ספל והסביבה המפורסמת push-T. בגדול הם לקחו את מה שכבר סקרנו בעבר stable diffusion לעולם הרובוטיקה, …
…
continue reading
![Artwork](/static/images/128pixel.png)
1
שיפור וודאות במודלים: הצצה לעולם של ניבוי קונפורמי
30:14
30:14
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
30:14אחרת הטכניקות הקלאסיות (משנות ה80) שזוכה לאחרונה לפופולאריות מחודשת היא Conformal Prediction. ברוב משימות הניבוי, לא מספיק לחזות רק מה התוצאה הכי סבירה - אלא מה הן מגוון האפשרויות, ומה הסבירות. ניקח למשל רופא שצריך לאבחן מטופל על סמך הסימפטומים, תוצאת הדיאגנוזה שלו תגרור את הטיפול המתאים. לכל אבחנה מתוך סט האבחנות יש סיכוי, וייתכן שיידרשו בדיקות נו…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
GPT-o1: האם אנחנו קרובים להבנה אמיתית?
40:00
40:00
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
40:00בפרק הבא נדבר על הגרסה החדשה GPT-4o1, שמבטיחה יכולות מתקדמות של הסקת מסקנות. מייק יסביר כיצד המודל מנסה להתמודד עם בעיות מורכבות שדורשות יכולת לוגית מרובה, ומעלה את השאלה האם המודל באמת מצליח להתמודד עם משימות הסקה מורכבות או שמא הוא "מגזים" בהערכותיו. נבדוק גם את ההבדלים בין גרסאות קודמות, כמו GPT-3 ו-GPT-4, ונבחן את האתגרים וההזדמנויות שהגרסה החד…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
Mechanistic Interpretability עם מייק ארליכסון
41:58
41:58
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
41:58בפרק הבא, נצלול לנושא המורכב של מכניסטית אינטרפרטביליות (Mechanistic Interpretability) במודלים של שפה, וננסה לפשט את הדרך בה ניתן להבין מה מתרחש בתוך מודלים אלה. נסביר כיצד מודלים בשימוש רחב כמו טרנספורמרים ומבנים מתמטיים אחרים מנסים לפענח את מנגנוני השפה, אבל נדבר גם על הקושי להבין מה באמת קורה "מאחורי הקלעים" של רשתות נוירונים עמוקות. נבין את השי…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
להגדיר מחדש את החיפוש: חידושים ב - RAG עם ניר דיאמנט
33:11
33:11
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
33:11בפרק הבא, נארח את ניר דיאמנט, יועץ בתחום הבינה המלאכותית הגנרטיבית (GenAI) שיספר לנו על המסע המקצועי שלו והתפתחויות חדשניות בתחום. ניר מצטרף אלינו בעקבות תרומתו המשמעותית לשיטות RAG (Retrieval-Augmented Generation) כולל פיתוחים כמו GenAI Agents ו-Controlable RAG, שזכו להכרה רחבה ואף פורסמו על ידי מנכ״ל LangChain, האריסון צ׳ייס, כתכנים הפופולריים בי…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
מדע הנתונים – איך הוא השתנה לאורך השנים עם דניאל אהרונוביץ'
39:59
39:59
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
39:59בפרק הזה דניאל ארונוביץ', מדען נתונים ותיק, מספר על המסע האישי שלו בתעשיית הטכנולוגיה לאורך 15 שנים. ניגע בהבדלים הבולטים בין העבר להווה, בכלים שהשתמשו בעבר לעומת הכלים שמשתמשים בהם היום שמחברים את המדע ישר לפרודקשן. דניאל מתאר את השינויים במיומנויות הנדרשות ממדעני נתונים, מיכולת ניתוח בלבד להכרח להבין תהליכי פיתוח וניהול גרסאות. נשוחח על האתגרים ה…
…
continue reading
החודש גוגל פרסמו את NotebookLM, שירות AI שמייצר שיחת עומק מוקלטת בין שני דוברים לא אמיתיים.כדי לבדוק את העניין, העלנו תמלול של "רק לא RAG" פרק הטיפים של אורי גורן מארגמקס על נסיונו עם ארכיטקטורת הRAG.והתוצאה, הפילה אותנו מהרגליים. נשמח לשמוע מה דעתכם? האם אפשר למכור את המיקרופון והציוד הקלטה ביד2?על ידי Tamir Nave & Uri Goren
…
continue reading
![Artwork](/static/images/128pixel.png)
1
Data Science בעולם הביטוח עם דוד שוקרון
28:54
28:54
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
28:54בפרק הזה, דוד שוקרון, Head of DS & AI בביטוח ישיר, מספק הצצה לעולם מדעי הנתונים בתעשיית הביטוח. נשמע ממנו על ההבדלים בין אקטואריה ל-Data Science, ועל איך משלבים DS במערכות ותיקות של חברות ביטוח דוד יסביר על יישומי DS בתעשייה עתירת נתונים כמו ביטוח, בשימוש בכלים ומודלים שונים, כולל השאלה אם יש צורך בכלים ייחודיים או שניתן להסתפק במוצרי מדף קיימים. ב…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
LLM לייעוץ השקעות עם אלעד נחמיאס
28:50
28:50
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
28:50בפרק זה, אנחנו נשוחח עם אלעד נחמיאס CTO של Bridgewise, על השימוש במודלי שפה גדולים (LLMs) בתחום ההשקעות. אלעד יסביר לנו איך משלבים טכנולוגיות מתקדמות כדי לשפר תהליכי הייעוץ והאנליזה, תוך התמודדות עם אתגרים כמו דיוק הנתונים, הטיות פוטנציאליות ושמירה על פרטיות המידע. נשמע על האתגרים הטכניים והאתיים של יישום LLMs, איך Bridgewise מוודאת שהפתרונות שלה נ…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
Adaptive-RAG עם לירון יצחקי אלרהנד
30:35
30:35
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
30:35בפרק הזה, נצלול יחד עם לירון יצחקי אלרהנד ל Interleaving Retrieval with Chain of Thought (IRCoT) שיטה לשיפור מערכות שאלה ותשובה על ידי הרחבה איטרטיבית של תהליך חשיבה ואחזור מידע רלוונטי. נדבר על טכניקות שונות של אחזור אדפטיבי, נשווה את יעילותן על סמך מורכבות השאלה, ונדגיש את החשיבות של בחירת הגישה הנכונה לתרחישים שונים המלצות של לירון למי שמועניין …
…
continue reading
![Artwork](/static/images/128pixel.png)
1
Task Aware Embedding עם ענבל חורב
18:30
18:30
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
18:30לא רק היופי הוא בעיניי המתבונן, מסתבר שגם הדימיון הסמנטי בפרק הזה ענבל תספר לנו איך התגלגלה מטוקיו ל בגונג senior staff researcher כשחושבים על אמבדינגז, הרבה פעמים חושבים על חיפוש וקטורי ו RAG נדבר על החשיבות של אמבדינג טוב דווקא בשלב הכרת הדאטא ובחירת דוגמאות מעניינות לאימון. נסקור את ההיסטוריה של אמבדינג, ללא הקשר, עם הקשר, ועד Task aware embeddi…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
מלימודים הומניסטים למדעי הנתונים - פרק בשיתוף עם YData
28:54
28:54
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
28:54בפרק זה ריאיינו את אורי גוטליב ונטע בר על המעבר שלהם לעולם ה data science במסגרת ההכשרה שלהם ב YData.על הפער העצום בין התאוריה לעבודה מעשית ועל הפרויקט שעשו שהביא אותם לעבודה הנוכחית שלהם. קישורים: אורי גוטליב נטע בר wids il facebook Wids-linkdin קהילת באותעל ידי Tamir Nave & Uri Goren
…
continue reading
![Artwork](/static/images/128pixel.png)
1
בינה מלאכותית וצ'יפים - עם ד"ר אמיתי ערמון
37:06
37:06
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
37:06אינטל העולמית נמצאת השבוע בכותרות בעקבות ההצהרה על הצמצומים, וזו הזדמנות מעולה להזכיר על הפעילות המדהימה של קבוצת הדאטא סיינס של אינטל ישראל. החודש פורסם כי הקבוצה AI Solutions Group זכתה בפרס הארגון המצטיין העולמי של אינטל. בפרק זה ד"ר אמיתי ערמון יספר לנו על התפקיד שלו בתור ה Chief Data Scientist של הקבוצה, מה היא עושה? מה האתגרים היחודיים שלהם? …
…
continue reading
![Artwork](/static/images/128pixel.png)
1
על מודלים פתוחים, רשיונות ורגולציה עם עופר חרמוני
30:17
30:17
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
30:17קוד פתוח זה נושא מורכב, יש כמה סוגים של רשיונות כמו GPL, Apache, MIT וכו׳.העניינים מסתבכים עוד יותר כשמדברים על מודלים פתוחים, האם קוד המודל פתוח? אולי רק המאמר? אולי רק המשקולות פתוחות? ומה לגבי הדאטא?בפרק זה עופר חרמוני, יועץ בתחום הAI וחבר בLinux foundationיספר על הקריטריונים של הארגון למודלים פתוחים, ונמנה מספר מודלים כאלו. עולם הAI מתקדם בקצב …
…
continue reading
גיא אדלר מחברת אקסיליון יחלוק איתנו מנסיונו בפיתוח ושימוש במערכות סימולציה לעולם התחבורה.אקסיליון מפתחת מוצר לעיריות לצורך אופטימיזציה של רמזורים ותנועה, כדי שכולנו נבלה כמה שפחות זמן בפקקים. נדבר על האתגרים בתחזית של אירועים נדירים כגון מזג אוויר, הופעות, ושיבושי תנועה.ועל החשיבות של עבודה משותפת עם מומחי תוכן ואינטגרציה עם מערכות אמיתיות של עיריו…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
ניסויים מדעיים באמצעות סימולציות - עם רותם רוזנבלום
33:50
33:50
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
33:50פרק פיצוץ על איך סימולציות יכולות לעזור לנו לחזות תגובה של חומרי נפץ במתחים שונים.בפרק זה רותם תספר לנו על המחקר האקדמי שלה בשיתוף עם רפאל, ועל איך סימולציות עזרו לחסוך המון כסף וזמן על ניסוי שטח.נדבר על ההבדלים בין סימולציות סדרתיות, ובין סימולציות אגרגטיביות.ומדוע סימולציות הם הכלי הנכון לבדוק את המודל שלנו בכל מיני מקרי קצה נדירים, או שטרם קרו. …
…
continue reading
![Artwork](/static/images/128pixel.png)
1
על ההיסטוריה של סימולציות עם יניב טננבאום קטן
30:36
30:36
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
30:36סימולציות היו פעם כלי הניבוי המרכזי, והיום הוחלפו על ידי מודלי למידת מכונה.האם מדובר בכלי מיושן ולא רלוונטי, או באומנות עתיקה שנשכחה.בפרק זה נדבר על המוטיבציות לסימולציות אל מול הרצת ניסויים על דאטא אמיתי, ונדבר על החוזקות והחולשות מול מודלי למידת מכונה. קורס חינמי של אוניברסיטת חיפה על סימולציותעל ידי Tamir Nave & Uri Goren
…
continue reading
![Artwork](/static/images/128pixel.png)
1
המלצות, סימולציות, שינוי העדפות ודילמות טווח ארוך - טווח קצר - עם פרופ׳ עומר בן פורת
40:11
40:11
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
40:11מערכות המלצה נתפסות לרוב כבעיית רגרסיה או קלאסיפיקציה, בפרק זה פרופסור עומר בן פורת מהטכניון ואורי ינהלו דיון טכני על האתגרים במידול סטטי כזה.נדבר על יצירת העדפות, ועל האחריות המשפטית של מערכת ההמלצה.מערכת המלצה אמורה למדל אנשים, ואנשים הם לא יצור רציונאלי או עקבי - כיצד מערכת ההמלצה אמורה להתמודד עם זה? ונדבר על החשיבות של סימולציה למדידה ואימון מ…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
Consistency Large Language Models עם מייק ארליכסון
29:12
29:12
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
29:12למודלי שפה (גדולים) יש שלושה תת-מודלים: הטוקנייזר, הטרנספורמר, ואלגוריתם הפענוח. אלגוריתם הפיענוח בדרך כלל אינו נלמד, אלא הוא איזה שהיא יוריסטיקה סדרתית של חיפוש בעץ על סמך ההסתברויות של הטרנספורמר.אבל מי מבטיח שהיוריסטיקה הזו היא הדבר האידיאלי לעשות בהנתן הפלט של הטרנספורמר.Consistency LLMs מנסים לקשור את שתי הקצוות, ולהתאים את ההטרנספורמר לאלגורי…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
Predictive mean matching and imputation - השלמת ערכים חסרים איטרטיבית
8:28
8:28
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
8:28ערכים חסרים הם נחלתו של כל מי שעוסק בעיבוד מידע טבלאי, הפעם נתמקד בהשלמת ערכים רציפים עם Predictive mean matching.אחת השיטות הנפוצות MICE, לא היתה זמינה עד לאחרונה למשתמש פייתון - וכעת נמצאת במודול הexperimental של scikit learn. נעשה סקירה קצרה על מתי כדאי להשלים ערכים חסרים ומתי לא, ונדבר על השיטות הנפוצות להשלמה.…
…
continue reading
הרבה מאיתנו שמעו בכותרות על KAN פה, KAN שם - ולא היה ברור מה המהומה. Kolmogorov Arnold network זו ארכיטקטורה שמאיימת לשנות את איך שאנחנו חושבים על רשתות נוירונים, החל במבנה של נוירון ועד יכולת ההסבר.בנוסף, לרשתות כאן יש פי עשר פחות פרמטרים והן דלילות יותר - נשמע מדהים.אבל, הפוטנציאל הוא גדול אבל המציאות היא בפרטים הקטנים - אותם נכסה בפרק הזה…
…
continue reading
מי לא שמע על RAG, נראה שכולם מדברים, מממשים ומאפטמים ראגים לכל שימוש.בפרק זה אורי שוטח את משנתו על ראגים, וטוען שהם בשימוש יתר בתעשייה (יש יגידו הייפ), ואלו הן הסיבות1. אתם אחראיים (משפטית) על הפלט שלהם - אם אין בן אדם בלופ - יש בעיה2. שאילתות סמנטיות לא מתאימות להמון מקרים, חיפוש וקטורי הוא לא התשובה לretrieval3. זה נראה כאילו חיפוש וקטורי נועד לח…
…
continue reading
מירב גרימברג עוסקת למחייתה בפיתוח מנוע החיפוש הוקטורי של רדיס, הגיעה לספר לנו תובנות מבפנים.לאחרונה רואים שיותר ויותר דאטאבייסים ״מסורתיים״ מוסיפים פונקציונאליות של חיפוש וקטורי, רדיס הוא אחד מהם. רדיס, הוא היום שירות ברירת המחדל לחיפוש key-value מהיר בזמן אמת. וגם מנוע חיפוש וקטורי המממש את אלגוריתם הhnsw לחיפוש וקטורי מקורב. מירב תספר לנו על האיל…
…
continue reading
עכשיו כשהעולם רועש סביב מודלי שפה גדולים וחזקים שאינם טרנספורמרים (מאמבה, rwkv) - הגיע הזמן להיזכר מה הוא הטרנספורמר ומה היו המוטיבציות ליצירתו. פרק זה הינו שידור חוזר של פרק מ2020, האזנה מרתקת לאזניים של 2024.על ידי Tamir Nave & Uri Goren
…
continue reading
![Artwork](/static/images/128pixel.png)
1
כישורים רכים למדעני נתונים - עם בוריס גורליק
24:30
24:30
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
24:30בוריס גורליק, יועץ דאטא מנוסה עם רקע ניכר בדאטא טבלאי, ויזואליזציה וסדרות זמן - ידבר איתנו על דווקא על נושא אחר: Soft skills.מדעני נתונים, הם לא רק אנשים טכניים שיודעים להריץ פייתון ולאפטם מודלים - הכוונה ב״כישורים רכים״ זה לכל יכולת התקשורת בארגון ובצוות, ובעבודה במשותף כחלק מאתגר גדול יותר. נדבר על אתגרים נפוצים בחיי הDS ועל איך נכון לבנות מצגת ב…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
על למידה מונחית עצמית עם מייק ארליכסון Self Supervised
50:40
50:40
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
50:40בפרק זה אירחנו את מיכאל ארליכסון לדבר על self supervised learning. דיברנו על בעיית דלילות הסיגנל, ועלות התיוג. למידה self supervised מתמקדת בלמידת היצוג הוקטורי על ידי משימות שלא דורשות תיוג. לדוגמא, אם לקחנו תמונה ו הרעשנו אותה (או סיבוב, שיקוף, זום) נצפה שוקטור היצוג יהיה דומה. דיברנו על טכניקות שונות ללמידת יצוגים, כגון רשתות סיאמיות, למידה ניגו…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
על פרטיות דיפרנציאלית עם משה שנפלד
33:20
33:20
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
33:20יש הרבה עיסוק בסכנות הכרוכות בהדלפה של פרטים מזהים בדאטאסטים או בתוך משקולות של מודלים מאומנים. בפרק זה משה שנפלד, חוקר בתחום, יספר לנו כמה זה מורכב להפוך דאטאסט אנונימי ונדבר על כמה פדיחות שקרו בתחום. נדבר על האתגרים של אימון מודלים בצורה פרטית, והאם מדובר בסוג חדש של רגולרזיציה. נכסה אלגוריתמים כמו k-annonimity ונדבר על Differential privacy שהיא …
…
continue reading
![Artwork](/static/images/128pixel.png)
1
איך ללמד מודל שפה לדבר כמו ערס עם חן מרגלית מ LSports
27:53
27:53
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
27:53בפרק זה חן מרגלית סיפר על פיתוח SEC by LSportsהבוט שמתמצת ועונה על שאלות על משחקי ספורט. הבעיה העיקרית היא שרוב מודלי השפה אומנו על ויקיפדיה, כתבות ואתרי שאלות ותשובות - ולא שפה השגורה במגרשי הכדורגל. חן יספר על התהליך של יצירת הדאטא, פיינטון וכמובן שרשרת המודלים ליצירת התחזיות שקדמה למענה של הצ׳טבוט.…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
AlgoGen - שילוב של אלגוריתמים ומודלי שפה גנרטיביים, עם אמיר שחר
28:11
28:11
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
28:11בפרק זה אמיר שחר יספר על שיטה חדשנית שפרסם לשילוב מודלי שפה יחד עם אלגוריתמים. לפני 20 שנים, כנראה שאם הייתם אומרים AI הייתם מתכוונים לאלגוריתמי חיפוש בעצים. אלגוריתמי חיפוש כמו A Star מנצחים מסטרים בשח מט, ואפילו עוזרים לנו להתמצא בעיר עם Waze. למעשה, אם מסתכלים עמוק בתוך LLM מגלים גם בו שימושים באלגוריתמי חיפוש. אמיר יספר מנסיונו איך אפשר לשפר אל…
…
continue reading
![Artwork](/static/images/128pixel.png)
1
מערכות המלצה כמשק כלכלי - עם ד״ר עומר בן פורת
24:08
24:08
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
24:08נהוג להסתכל על מערכת המלצה כאל בעיית אופטימיזציה, איזה סרטון לנגן כך שיהיו הכי הרבה צפיות בהתחשב בהיסטוריית הלקוח.אבל אם לוקחים צעד אחורה, מגלים שאנחנו בשוק מסחר תלת צדדי. לסרטונים יש יוצרים, ולפלטפורמה יש בעלי מניות, וכמובן - אנחנו הצופים. כמובן שאם הפלטפורמה לא תהיה רווחית, תהיה בעיה בטווח המיידי - אבל גם אם יוצרי התוכן לא יזכו לחשיפה הם ינטשו את…
…
continue reading