אורי גורן ותמיר נווה מדברים על Machine Learning ואתגרים בתעשייה עם מומחים מהתחום.
…
continue reading
מייצר כוחות על למהנדסי תוכנה. .איסן ריבקין מגיש פודקאסט על תוכנה תהליכים והאנשים שביניהם
…
continue reading
מי לא שמע על RAG, נראה שכולם מדברים, מממשים ומאפטמים ראגים לכל שימוש.בפרק זה אורי שוטח את משנתו על ראגים, וטוען שהם בשימוש יתר בתעשייה (יש יגידו הייפ), ואלו הן הסיבות1. אתם אחראיים (משפטית) על הפלט שלהם - אם אין בן אדם בלופ - יש בעיה2. שאילתות סמנטיות לא מתאימות להמון מקרים, חיפוש וקטורי הוא לא התשובה לretrieval3. זה נראה כאילו חיפוש וקטורי נועד לח…
…
continue reading
מירב גרימברג עוסקת למחייתה בפיתוח מנוע החיפוש הוקטורי של רדיס, הגיעה לספר לנו תובנות מבפנים.לאחרונה רואים שיותר ויותר דאטאבייסים ״מסורתיים״ מוסיפים פונקציונאליות של חיפוש וקטורי, רדיס הוא אחד מהם. רדיס, הוא היום שירות ברירת המחדל לחיפוש key-value מהיר בזמן אמת. וגם מנוע חיפוש וקטורי המממש את אלגוריתם הhnsw לחיפוש וקטורי מקורב. מירב תספר לנו על האיל…
…
continue reading
עכשיו כשהעולם רועש סביב מודלי שפה גדולים וחזקים שאינם טרנספורמרים (מאמבה, rwkv) - הגיע הזמן להיזכר מה הוא הטרנספורמר ומה היו המוטיבציות ליצירתו. פרק זה הינו שידור חוזר של פרק מ2020, האזנה מרתקת לאזניים של 2024.על ידי Tamir Nave & Uri Goren
…
continue reading
1
כישורים רכים למדעני נתונים - עם בוריס גורליק
24:30
24:30
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
24:30
בוריס גורליק, יועץ דאטא מנוסה עם רקע ניכר בדאטא טבלאי, ויזואליזציה וסדרות זמן - ידבר איתנו על דווקא על נושא אחר: Soft skills.מדעני נתונים, הם לא רק אנשים טכניים שיודעים להריץ פייתון ולאפטם מודלים - הכוונה ב״כישורים רכים״ זה לכל יכולת התקשורת בארגון ובצוות, ובעבודה במשותף כחלק מאתגר גדול יותר. נדבר על אתגרים נפוצים בחיי הDS ועל איך נכון לבנות מצגת ב…
…
continue reading
1
על למידה מונחית עצמית עם מייק ארליכסון Self Supervised
50:40
50:40
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
50:40
בפרק זה אירחנו את מיכאל ארליכסון לדבר על self supervised learning. דיברנו על בעיית דלילות הסיגנל, ועלות התיוג. למידה self supervised מתמקדת בלמידת היצוג הוקטורי על ידי משימות שלא דורשות תיוג. לדוגמא, אם לקחנו תמונה ו הרעשנו אותה (או סיבוב, שיקוף, זום) נצפה שוקטור היצוג יהיה דומה. דיברנו על טכניקות שונות ללמידת יצוגים, כגון רשתות סיאמיות, למידה ניגו…
…
continue reading
1
על פרטיות דיפרנציאלית עם משה שנפלד
33:20
33:20
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
33:20
יש הרבה עיסוק בסכנות הכרוכות בהדלפה של פרטים מזהים בדאטאסטים או בתוך משקולות של מודלים מאומנים. בפרק זה משה שנפלד, חוקר בתחום, יספר לנו כמה זה מורכב להפוך דאטאסט אנונימי ונדבר על כמה פדיחות שקרו בתחום. נדבר על האתגרים של אימון מודלים בצורה פרטית, והאם מדובר בסוג חדש של רגולרזיציה. נכסה אלגוריתמים כמו k-annonimity ונדבר על Differential privacy שהיא …
…
continue reading
1
איך ללמד מודל שפה לדבר כמו ערס עם חן מרגלית מ LSports
27:53
27:53
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
27:53
בפרק זה חן מרגלית סיפר על פיתוח SEC by LSportsהבוט שמתמצת ועונה על שאלות על משחקי ספורט. הבעיה העיקרית היא שרוב מודלי השפה אומנו על ויקיפדיה, כתבות ואתרי שאלות ותשובות - ולא שפה השגורה במגרשי הכדורגל. חן יספר על התהליך של יצירת הדאטא, פיינטון וכמובן שרשרת המודלים ליצירת התחזיות שקדמה למענה של הצ׳טבוט.…
…
continue reading
1
AlgoGen - שילוב של אלגוריתמים ומודלי שפה גנרטיביים, עם אמיר שחר
28:11
28:11
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
28:11
בפרק זה אמיר שחר יספר על שיטה חדשנית שפרסם לשילוב מודלי שפה יחד עם אלגוריתמים. לפני 20 שנים, כנראה שאם הייתם אומרים AI הייתם מתכוונים לאלגוריתמי חיפוש בעצים. אלגוריתמי חיפוש כמו A Star מנצחים מסטרים בשח מט, ואפילו עוזרים לנו להתמצא בעיר עם Waze. למעשה, אם מסתכלים עמוק בתוך LLM מגלים גם בו שימושים באלגוריתמי חיפוש. אמיר יספר מנסיונו איך אפשר לשפר אל…
…
continue reading
1
מערכות המלצה כמשק כלכלי - עם ד״ר עומר בן פורת
24:08
24:08
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
24:08
נהוג להסתכל על מערכת המלצה כאל בעיית אופטימיזציה, איזה סרטון לנגן כך שיהיו הכי הרבה צפיות בהתחשב בהיסטוריית הלקוח.אבל אם לוקחים צעד אחורה, מגלים שאנחנו בשוק מסחר תלת צדדי. לסרטונים יש יוצרים, ולפלטפורמה יש בעלי מניות, וכמובן - אנחנו הצופים. כמובן שאם הפלטפורמה לא תהיה רווחית, תהיה בעיה בטווח המיידי - אבל גם אם יוצרי התוכן לא יזכו לחשיפה הם ינטשו את…
…
continue reading
רשתות נוירונים על שלל סוגיהן זוכות להרבה אטנשן - אבל בפועל, הרבה פרויקטים לא זקוקים לרשתות נוירונים.מודליים עציים הם בדרך כלל הפתרון הפשוט והיעיל לדאטא טבלאי.בפרק קצרצר זה, נסקור את עצי החלטה, תהליך אימונם ובעיית הOverfit.נדבר על שתי ההרחבות הנפוצות:Random Forest & Gradient Boosted Trees והיתרונות שיש בשימוש במודלים ותיקים בסביבת פרודקשן…
…
continue reading
1
אימות פורמלי של רשתות נוירונים עם איתי בוחניק וד״ר גיא אמיר
31:06
31:06
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
31:06
נדירים המקרים בהם שני תחומים כ״כ רחוקים במדעי המחשב נפגשים, ועוד זוכים להגיע לפרודקשן. אימות פורמלי הוא תחום העוסק בוידוא מתמטי שתוכנית אמורה לרוץ בלי תקלות, והוכחה שהתוכנית מקיימת תכונות מסוימות. בדרך כלל רואים אימות פורמלי בתחומים כמו קומפילציה או לוגיקה, ולכן היה מרתק לשמוע איך שיטות תאורטיות כאלו מצאו את עצמן בישום אצל חברת אלביט המפתחת רשתות נ…
…
continue reading
1
Decoding ChatGPT, Transformers, Vector DB, RAG and more, Roy Miara Pinecone
25:02
25:02
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
25:02
פרק עשיר במידע שמביא לכם פירוט מרתק כיצד מערכות צ'אט כמו ChatGPT פועלות, ומשיגות את היעדים שלהן באמצעות טכנולוגיות מתקדמות כמו Transformers, Vector DB, ו-RAG.האורח היום רועי מיארה מPinecone.- Follow the Podcast on Facebook, on Instagram or LinkedIn.- Want More from Roy? check his LinkedIn. - Pinecone careersEpisode Subjets: - Attention is all you n…
…
continue reading
1
Mamba סיכום מנהלים ותחזיות לעתיד,עם מייק ארליכסון
45:12
45:12
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
45:12
עולם מודלי השפה מושתת על ארכיטקטורת הטרנספורמר שמכילה בעיה מובנית בתוכה - סיבוכיות ריבועית בקלט, ולאחרונה אלטרנטיבות מעניינות לטרנספורמר הגיחו לחיינו. פרק זה הינו פרק שני בסדרה, והוא סיכום מנהלים על עקרון הדואליות, מוטיבציה ותחזיות להמשך. מייק ואני נדבר על איך דואליות משפיעה על אימון יעיל והוזלה של עלויות, על ארכיטקטורות חומרה והתאמתן לטרנספורמרים.…
…
continue reading
1
Mamba סקירה טכנית עם מייק ארליכסון
49:30
49:30
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
49:30
יש הרבה התרחשויות סביב ארכיטקטורות חדשות (שאינן טרנספורמר) שיכולות להיות המנוע מאחורי הLLM הבא. פרק זה הינו פרק ראשון מתוך שניים, על Mamba ו State Space Models שנראים אלטרנטיבה מבטיחה. נצלול טכנית למוטיבציה ולאלגוריתמים המתמטיים, ואיך פולינומי לג׳נדר קשורים לעניין. הפרק טיפה טכני מהרגיל, בפרק הבא נעלה רמה ונסקור את ההשלכות ותחזיות לדעתנו.…
…
continue reading
1
עולם ללא עוגיות - פרק הפוך עם דין פלבן
33:54
33:54
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
33:54
פרק משותף עם דין פלבן מ The MLOps Podcastעל הנושא שמעסיק את עולם הפרסום היום. ברוח חקיקה אירופאית ואמריקאית, נהיה קשה יותר ויותר מבחינה חוקית לעקוב אחרי התנהגות משתמשים עם קוקיז (עוגיות).לשמירה על הפרטיות יש גם צד שנוגע לנו, אנשי הדאטא בכל הקשור למדידת איכות אלגוריתמים ולמידה. בפרק זה דין ייארח את אורי ונדון על מה אפשר לעשות.…
…
continue reading
1
למידה מולטי מודאלית עם ד״ר חן חג׳ג׳
27:55
27:55
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
27:55
מודלים מולטי-מודאלים הגיעו לקידמת הבמה לאחרונה עם מודלים כמו chatGPT, Whisper, Midjourney.נדבר על האתגרים בשילוש מודלים חזותיים, טקסטואלים וגרפיים - כאשר המימדים שונים, המימדים שונים, ואיך מרוויחים מהשילוב הזה.נדבר על cross modal learning - איך אפשר ללמד מודל אחד על סמך מודאליות של מודל אחר.על ידי Tamir Nave & Uri Goren
…
continue reading
1
ניהול פרויקטי דאטא סיינס עם חן קרני
22:39
22:39
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
22:39
ניהול אנשים זה אתגר, ניהול מחקר עם תוצר לא-וודאי - זה אתגר, וניהול ממשקים עם פרודקט,תוכנה והנהלה בכירה זה בכלל מורכב. בפרק זה אירחנו את חן קרני, מנהלת מנוסה בתחום הדאטא לדבר על איך עושים את זה נכון, וללמד מה עבד עבורה.איך לפרק פרויקטים גדולים למשימות קטנות (בשיטת הסלאמי) שאפשר לתקשר, איך למדוד ולהגדיר יעדים (שגם אפשר לעמוד בהם), ומה הם השלבים בפרוי…
…
continue reading
1
טרנספורמרים בעיבוד תמונה Visual Transformers
29:50
29:50
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
29:50
טרנספורמרים הם ללא ספק המודל המועדף בעיבוד שפה - אבל האם גם בתמונות?אז... מסתבר שהתמונה לא כל כך ברורה בעיבוד תמונה.בפרק זה נדבר על היתרונות הגדולים של טרנספורמרים בתמונות - ועל הסיטואציות שבהן CNN מנצחות אותם. קישורים Attention is All You Need An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale End-to-End Object Detection wi…
…
continue reading
1
על אינטלגנציה מלאכותית בעולם המשפט - עם עומר חיון
36:22
36:22
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
36:22
לפני כשש שנים עומר חיון ואורי גורן התחילו הרפתקאה בעולם הLegal tech והקימו את BestPractix בסט פרקטיקס התמקדה בשלב הטיוטות של החוזים, והיוותה כלי עזר לעורכי דין לזהות ״אנומליות״ בחוזים (שבדרך כלל די סטנדרטים), והצעה של אלטרנטיבות מקובלות יותר.בשנת 2020 בסט פרקטיקס נמכרה לLitera Systems האמריקאית, ועומר הועבר להמשך הפיתוח. הרבה השתנה בעולם הAI מאז, ו…
…
continue reading
1
AI Junk - איך עושים למידת מכונה עם קרטון ביצים
25:35
25:35
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
25:35
דיברנו הפעם על פרויקט ai-junk המאפשר לכל אחד ליצור רובוטים מגרוטאות וליצור ולאמן מודלי reinforcement learning שישלטו ברובוטים. ובכך ליצור עולם משחק מרובה רובוטים על הריצפה בסלון.דיברנו על מה זה RL, על הקשיים להפוך RL שעובד טוב בוירטואלי לעולם הפיסי, על כמה נחמד ללמוד על התחום דרך רובוטים :)הפרק הוקלט לפני המלחמה ששיבשה לנו הכל וארועים שתוכננו בוטלו…
…
continue reading
1
מה עושים כשיש מעט נתונים - עם נתנאל דוידוביץ
27:24
27:24
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
27:24
נתנאל, דאטא סיינטינסט ותיק שמוביל היום את המחקר בדאבל וריפיי ידבר איתנו על בעיה כואבת אך נפוצה. גייסנו תקציבים, כוח אדם, ועם הרבה רצון ומוטיבציה ניגשנו לפרויקט חדש - פתחנו את מכסה המנוע, וגילינו לצערינו שאין מספיק נתונים- מה הלאה ? נדבר על שלוש טקטיקות שאפשר לנקוט, בין אם זה תיוג עצמאי ורכישת דאטא, שימוש במודלים כגון Label spreading, transfer learn…
…
continue reading
יצא לנו הרבה לדבר על מודלי שפה גדולים לאחרונה, ועל השימושים שלהם. למעט שימוש בצ׳אטבוט או כעזר לכתיבה, לרוב אנחנו רוצים לקבל את הפלט של המודל בפורמט כלשהו כמו Json / Data Class נדבר על שלושת השלבים ביצירת הפלט, הטוקנייזר, הטרנספורמר, והמפענח. ונסביר איך אפשר להתערב במפענח כדי לאלץ את המודל כדי לקבל תשובות במבנה מסוים, להכריח את מודל לענות ״כן״ או ״ל…
…
continue reading
1
על מודלי שפה גדולים בפרודקשן עם איתי ציטבר
36:39
36:39
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
36:39
בפרק זה אירחנו את איתי ציטבר רש"צ מהיירו - לדבר על מודלי שפה בפרודקשן. המודלי צ'אט כ"כ חזקים - האם בכלל נשאר מה לעשות חוץ מאשר לחבר את הAPI לאתר ?מצד שני, זה נראה כאילו כולם משתמשים בLLM, גם כאשר קיימים מודלים פשוטים יותר.נדבר על מה קורה כשהמלצת המודל מתנגשת עם נהלים רפואיים, מה קורה שהמודל נותן הנחיות שגויות למטופל, ואין אפשר לצמצם את התופעה עם Re…
…
continue reading
1
איך נולדים נתונים מתויגים עם דניאל מנוחין
23:47
23:47
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
23:47
בפרק זה אירחנו את דניאל מנוחין, מנהלת קהילת data-ops המובילה את התיוג וטקסונומיה ב ebayבסופו של דבר, מודלים טובים ככל שיהיו - חסומים על ידי איכות הדאטא עליהם הם אומנו.דניאל תספר על החוויות שלה בebay, על נקודות כשל קלאסיות בתהליך התיוג ועל איך בונים פרוטוקול אנוטציה אחיד.נדון בהבדל בין מתייגים in-house שהם ממש חלק מהארגון, לעומת מתייגים חיצוניים (כד…
…
continue reading
זה מרגיש כאילו עולם הלמידה מחולק ל2 מחנות, הסטטיסטיקאים ואנשי מדעי המחשב.ולאחרונה יצא מודל AGLM שהוא רעידת אדמה בעולם האקטואריה (ביטוח, פיננסים), וכנראה שרובנו לא שמענו עליו.בפרק זה נסקור מה אלו מודלי GLM, ספוילר - אחד מהם - הרגרסיה הלוגיסטית, אתם מכירים היטב.נדבר על השימושים שלהם, היתרונות שלהם בתחום הפיננסים בעקבות יכולת ההסבר שלהם, ונדבר גם על ה…
…
continue reading
ב-10 באוגוסט, חברת האשיקורפ אשר מפתחת את טרפורם גרמה לרעש בקרב קהילת התוכנה עם ההחלטה לשנות את כל מוצרי הקוד הפתוח שלה לרישיון מחמיר. בפרק הזה, מתארח עומרי, בין מייסדי חברת env0 ואחד המקימים של עמותת OpenTF שמטרה להבטיח ש-Terraform יישאר בקוד פתוח על אמת ושל הקהילה. מה הבעיה ברשיון החדש? למה זהו סיפור שצריך לעניין כל אשת DevOps בעולם? איך בין לילה …
…
continue reading
1
עם שוקי ויואל על מאחורי הקלעים של One Shot Learning
34:34
34:34
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
34:34
מי לא מכיר את שוקי ויואל - הגאונים מאחורי ערוץ היוטיוב האדיר שמביא את תרבות הלייב קודינג בעולמות למידת המכונה לארץ הקודש.וואן שוט לרנינג התחיל לפני כשנתיים כרעיון, ומאז הפך לקאלט של ממש.אבל מאחורי כל סרטון של חצי שעה, מסתתרת עבודה רבה, מחקר, באגים, והמון נסיונות שהלכו לפח.בפרק זה אורי ראיין את שוקי ויואל על מאחורי הקלעים של ההפקה, ושואל שאלות קשות.…
…
continue reading
בפרק זה אירחנו את מורן קורן, חוקר ומרצה לתורת המשחקים מאוניברסיטת בן גוריון. דיברנו בעבר שימוש בערכי שייפלי לפרשנות מודלים, ערכי שייפלי הם נושא מחקר פעיל בתורת המשחקים והחלטנו להעמיק ולשפוך אור על תורת המשחקים ואיך הרעיונות משלימים את הנחקר בלמידת מכונה. דיברנו על המונחים, מהו שיווי משקל ? איך מגדירים משחקים לפי ידיעה שלמה או גורל, על אסטרטגיה אופט…
…
continue reading
1
לנתץ את שלשלאות החומרה ועתיד הסלולר eSIM
28:57
28:57
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
28:57
היום בפרק מתארח איתמר ברקת CTO בחברת MobiMatter לדבר על הטכנולוגיה כרטיסי סים ודור העתיד. - מה זה eSIM ולמה בכלל צריך אותו? - איך eSIM הגיע לעולם (באיזה מכשירים, לאיזה צורך) ולמה לא כל מכשיר תומך בeSIM? - שימושים בeSIM בעולמות הIOT - איך בונים אפליקציות לסים? - למה בכלל צריך צ׳יפ מיוחד? - איך מבצעים גניבת זיהות באמצעות מידע על הסים? - פרוטוקול התקנ…
…
continue reading
1
על מערכות חיפוש - סיכום ביקור בכנס הייסטאק 2023 עם אמיר לבנטל
20:39
20:39
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
20:39
אמיר ואורי נסעו במסגרת עבודתם בארגמקס לכנס הייסטאק HayStack2023 המתמקד בחיפוש, ואימלקו לכם את הפרק לעשרים דקות צפופות על החידושים בתחום החיפוש בעידן ה Language models דיברנו על ארכיטקטורות חיפוש ובנוסף כוסו האלגוריתמים הבאים Splade Hyde Search augmentation with LLMעל ידי Tamir Nave & Uri Goren
…
continue reading
1
FinOps, חושפים את האמת עם אבישי איש שלום
35:59
35:59
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
35:59
עקב המצב בשווקים חזרנו לעונת ״חסכון בכסף״ וFinOps חזר להיות הטרנד החם. הבעיה בתפקיד כיום שמגלים את הבעיה לאחר מעשה וזה פוגע בסיכוי ליצור חיסכון אמיתי. היום בפרק מלא תובנות יצטרף אלינו איביש איש שלום לפרק שבו נהיה אמיתיים לגבי איך FinOps זה התפקיד של כולם, איך מתחילים בתרבות, ולמה יותר זה פחות. - מה הקשר בין ביצועים לכסף? -למה Auto Scale זה טעות שנו…
…
continue reading
1
מעבר לדאטא אנליסט לדאטא סיינס - בחסות YDATA
46:17
46:17
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
46:17
בפרק זה אירחנו את רותם דמבו ועומר דודי, שסיפרו לנו על המעבר שעשו בשנה האחרונה, מתפקיד של אנליסט לתפקיד של מדען נתונים. דיברנו על הפערים "התרבותיים" בין המקצועות, אילו יתרונות יש לאנליסט שמחפש להכנס לתחום מדעי הנתונים, אילו השלמות כדאי לעשות ואיזה טיפים יש להם לתת למי שנכנס לתחום. הם יספרו על ההחלטה לעשות את המעבר, על הלימודים בתוכנית Y-DATA, על איך…
…
continue reading
1
על למידה חיזוקית באימון מודלי שפה RLHF עם מייק
55:17
55:17
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
55:17
קשה לעבור ברחוב היום בלי לשמוע מישהו מספר לחברו על צ'אט ג'י פי טי או LLM אחד החידושים באימון שלו, למעשה ב InstructGPT היו השימוש בלמידה חיזוקית על בסיס דאטא מתויג אנושי בתהליך הדגימה נספר על אלגוריתם ה RLHF ושילובו בתוך מודלי השפה LLMעל ידי Tamir Nave & Uri Goren
…
continue reading
בפרק זה נדבר עם אוהד מדילטייל, העוסק בניתוח סיבתיות. אנחנו כולנו למדנו בטירונות דאטא סיינס ש Correlation does not imply causation אבל מה כן ? האם חייבים לבצע ניסויים מדוקדקים? והאם זה רלוונטי רק לעולם הרפואה או לכולנו ? קישורים: DoWhy tutorials אלגוריתמים - EconML docs Guide - Athey, Stuart, Vogelstein 2021 מאמר של אוהד https://arxiv.org/abs/2207.0…
…
continue reading
וקטורים, וקטורים בכל מקום ! דיברנו על מילים שהופכות לוקטורים, מסמכים שהופכים לוקטורים, תמונות שהופכות לוקטורים. אבל ברוב המקרים, נדרש חיפוש של וקטורים דומים למשימות של קלאסיפיקציה, דירוג ואפילו זיהוי אנומליות. חיפוש וקטורי בקנה מידה גדול זו בעיה הנדסית לא פשוטה, עם אילוצי זמן ריצה וזכרון. בפרק קצרצר זה, נסקור שלושה אלגוריתמים לחיפוש מקורב ונדבר על …
…
continue reading
1
איך באים תקצירי ווידאו של ספורט לעולם? NBA
33:33
33:33
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
33:33
הפעם ניצלול לעולם המרתק של תקצירי ספורט ואיך הם נוצרים אוטומטית עם טכנולוגיות חדשניות של עיבוד ווידאו ותמונה ולמעשה נחשוף את הקסם מאחורי הקלעים של כל התקצירים האלו שגורמים לנו לקפוץ מהספה כשגול מיוחד נכנס או שחקן מטביע (רמז: הכל אוטומטי). בפרק זה נדבר על כל השלבים שבהנגשת מוצר כזה עם החברה שאחראית על כל הקסם האוטומטי הזה בשלל סוגי ספורט כמו כדורסל,…
…
continue reading
1
על התאוריה של Replay Buffer עם שירלי די קסטרו שעשוע
20:55
20:55
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
20:55
פרק נוסף בתחום הלמידה החיזוקית, הפעם צוללים לפרטים הטכניים עם התאוריה מאחורי Replay Buffer סוכן, יכול ללמוד רק מהפעולות שלו - מה שנקרא On Policy או למידה גם מפעולות של סוכנים אחרים, מה שנקרא Off Policy בגישת הריפליי באפר, שומרים "הקלטה" של פעולות עבר ותוצאות עבר - ודוגמים מתוכן לצרכי הלמידה. שירלי תספר לנו על המחקר שלה לגבי השפעת גודל הבאפר, והשיפו…
…
continue reading
1
Tikal הופכים בית טיפש לחכם, חיים טורקל
39:05
39:05
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
39:05
בפרק זה הצטרף אלינו אורח מיוחד בשם חיים טורקל מחברת טיקל. חיים ישתף אותנו בעולם המרתק של בתים חכמים שבו נלמד איך להביא אוטומציה לחיי היום יום שלנו. נתחיל עם מהו בית חכם ואילו מוצרי חומרה טובים כדי להתחיל? לאחר מכן, נלמד איך להשתמש בפלטפורמת האוטומציה הביתית הפתוחה, Home Assistant. ונראה איך אפשר להשתמש בה לבניית מערכת ניטור צמחים, כמו כן גם איך לשל…
…
continue reading
פרק זה הוא חסות מיוחד בשיתוף אנבידיה, שמוקדש לג'וניורים. אנבידיה הפיקה את כנס ה GTC עם דגש מיוחד השנה של גנרטיב - להרשמה לחצו פה בפרק ראיינו חמישה דאטא סיינטיסטים טריים: צחי מורד, טלחיים דמארי, נתי מגור, דין עזרא ואבי חביב.על ידי Tamir Nave & Uri Goren
…
continue reading
בפרק זה אירחנו את איתן נצר, מ data heroes לדבר על בחירה חכמה של דגימות לצורך אימון מודלים. אנחנו בעידן הדאטא, נאספים טרות של אירועים מדי יום - אבל המודל שלנו לאו דווקא מרוויח מכל השפע הזה. האם אפשר להגיע לביצועים דומים עם שבריר הדאטא ובחירה חכמה של הדגימה ? איתן יספר לנו על גישת ה core set שחקר, והחליט לימים להקים את דאטאהירוז על מנת להנגיש את הטכנ…
…
continue reading
בפרק זה נציג את אתגר הלווינות החדש בסדרת MAFAT Challenge. אירחנו את ליאל ממפא"ת ואת שי ועידן מ-Webiks. דיברנו על מהפכת החלל, האתגר בזיהוי אובייקטים מתצלומי לוויין במאפיינים שונים וההבדלים ביחס לגילוי אובייקטים קלאסיים. קישור לתחרות: https://codalab.lisn.upsaclay.fr/competitions/9603על ידי Tamir Nave & Uri Goren
…
continue reading
1
זיהוי הונאות על ידי אנומליות עם אנדרס מRiskified
37:06
37:06
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
37:06
זיהוי אנומליות הוא נושא שימושי למגוון בעיות, זיהוי סנסורים דפוקים, אאוטליירים בדאטא או התנהגות חשודה. הבעיה היא שזיהוי אנמליות בפני עצמו הא לא תמיד שימושי, אם אין פעולה שאפשר לבצע בעקבות החריגה. נדבר על הגישות הקלאסיות לאנומלי, כגון * Density estimation * Auto regressive * Distance based measures ועל הבעייתיות שנובעת מחישוב מרחקים במימדים גבוהים. א…
…
continue reading
1
איך הופכים אתרים לנגישים (ונמנעים מתביעות) עם רן בר זיק Accessibility
26:43
26:43
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
26:43
הפעם אירחתי את רן בר זיק שבא לדבר איתנו. בפרק אנו חוקרים את החשיבות של נגישות באתרים ויצירת תוכן שמונגש לאנשים עם מוגבלויות בצורה ידידותית ומשפר את חווית המשתמש של כולם. בפרק למדנו על כלים אוטומטיים וחינמיים, טכניקות ושיטות על מנת להפוך את האתר שלנו למונגש. נושאי הפרק 3:00 - מה זו נגישות? 13:00 - איך ניתן לבדוק נגישות 14:50 - כלים אוטומטים Lighthou…
…
continue reading
1
איך לא להעסיק ג’וניורים במקצועות הדאטא
22:02
22:02
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
22:02
פרק זה הוא פרק סולו של אורי, בוא הוא יספר על החוויה שלו בפתיחת משרת ג'וניור בארגמקס. המשרה זכתה לחשיפה גבוהה ברשתות החברתיות והגיעה ל40 אלף איש בעקבות שיטת הגיוס הלא שגרתית. אורי יספר על מבחן הבית, ההיענות המפתיעה של מועמדים והביקורות שקיבל מקולגות לתחום. באם יש לכם נסיון או מומחיות בתחום גיוס הג'וניורים, נשמח לפידבק בקבוצת הטלגרם שלנו https://t.me…
…
continue reading
1
רשתות נוירונים על גרפים עם חגי מרון
31:06
31:06
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
31:06
בפרק זה אירחנו את חי מרון מ nvidia לדבר על עיבוד גרפים עם רשתות נוירונים. נדבר על ישומים של גרפים בחיים האמיתיים, ועל ההבדל האינהרנטי שבין גרף לבין "תמונה" או מטריצה כללית. נדבר על 4 הגישות הרווחות למידול שיטות ספקטרליות מודלי העברת הודעות רשתות אקוויורינטיות וכמובן, טרנספורמרים לקריאה נוספת: https://www.cs.mcgill.ca/~wlh/grl_book/files/GRL_Book.pd…
…
continue reading
1
יצירה אוטומטית של קוד עם פרופ ערן יהב וד”ר אורי אלון
1:01:31
1:01:31
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
1:01:31
בפרק קודם דיברנו על קודקס, מודל השפה שמאחורי Github Co-Pilot בפרק זה, החלטנו להעמיק ולראיין את ערן יהב, חוקר באקדמיה והמוח מאחורי TabNine ואורי אלון, פוסט דוקטורט בתחום שחוקר את הנושא הרבה לפני שזה היה מגניב. נדבר על ההיסטוריה של התחום, גישות מבוססות גרפים, דקדוק ומה הקשר בין שפת התכנות ליכולת החיזוי. כמו כן נדבר על אתגרים מוצריים ב TabNine ועל המע…
…
continue reading
הייתה לי ההזדמנות לראיין את מת׳ קליין היוצר של Envoy Proxy. זהו פרוקסי מודרני שנכתב בחברת Lyft. - מה זה פרוקסי? - Envoy / NGINX? - מה הפיצ׳רים שקיימים ב Envoy? - מה הוא control plane? - לאן עתיד התקשורת בענן הולך? I had the opportunity to speak with Matt Klein the creator of Envoy. Envoy is an open source edge and service proxy developed by Lyft th…
…
continue reading
1
Re-Invent 2022 AWS הסקירה השנתית של ההכרזות המעניינות
21:14
21:14
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
21:14
בפרק זה ערכתי סקירה של העדכונים וההכרזות המעניינות ביותר של אמזון בכנס השנתי שלהם בלאס ווגאס. הפרק מחולק לקטגוריות לפי: - 01:15 Application Development - פיתוח אפליקציות - 03:50 Big Data - ביג דטה - 09:10 Machine Learning - בינה מלאכותית - 11:20 Networking - רשתות תקשורת - 13:20 DevOps - תשתית - 17:45 Security - אבטחת מידע למסמך המלא המתאר את מקורו…
…
continue reading
נראה שעולם המודלים הגיעה לבשלות, לא פעם יוצא לנסות כמה מודלים שונים ולהגיע לאותן מטריקות. הטרנד של data centric ai שמוביל Andrew Ng דוגל בגישה שהפוקוס צריך לעבור לבחירה נכונה של הדאטא, ויצירה חכמה של דאטא סינטתי יותר מאשר אופטימיזציה של מודלים. סיגל שקד תספר לנו על הגישה החדשה וההבדלי מונחים אל מול גישות קלאסיות של resampling / augmentation קישורים…
…
continue reading
1
על חינוך בתחום הבינה המלאכותית עם שי פרח
30:28
30:28
נגן מאוחר יותר
נגן מאוחר יותר
רשימות
לייק
אהבתי
30:28
בפרק זה אירחנו את שי פרח ממכון וייצמן, מומחה להוראת המדעים. בעידן שלנו, ללמוד לתכנת זה כישור יסוד כמו קריאה וכתיבה בעידן המחשב. האם הגיע המקום לחשיבה בשיטת ai4all על משקל תנועת ה coding4all הפופולארי. דיברנו על הכשרות בתחום הבינה המלאכותית בתוכנית הלימודים. מה ההבדל בין "מדעי המחשב הקלאסי" לבין אפיון בעיה כ"למידת מכונה" מנקודת המבט של המהנדס.…
…
continue reading