Artwork

תוכן מסופק על ידי Rudderstack. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי Rudderstack או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.
Player FM - אפליקציית פודקאסט
התחל במצב לא מקוון עם האפליקציה Player FM !

171: Machine Learning Pipelines Are Still Data Pipelines with Sandy Ryza of Dagster

55:50
 
שתפו
 

Manage episode 393293177 series 3264623
תוכן מסופק על ידי Rudderstack. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי Rudderstack או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.

Highlights from this week’s conversation include:

  • The role of an orchestrator in the lifecycle of data (1:34)
  • Relevance of orchestration in data pipelines (00:02:45)
  • Changes around data ops and MLOps (3:37)
  • Data Cleaning (11:42)
  • Overview of Dagster (13:50)
  • Assets vs Tasks in Data Pipeline (19:15)
  • Building a Data Pipeline with Dexter (25:40)
  • Difference between Data Asset and Materialized Dataset (28:28)
  • Defining Lineage and Data Assets in Dagster (29:32)
  • The boundaries of software and organizational structures (37:25)
  • The benefits of a unified orchestration framework (39:56)
  • Orchestration in the development phase (45:29)
  • The emergence of analytics engineer role (51:53)
  • Fluidity in data pipeline and infrastructure roles (52:40)

The Data Stack Show is a weekly podcast powered by RudderStack, the CDP for developers. Each week we’ll talk to data engineers, analysts, and data scientists about their experience around building and maintaining data infrastructure, delivering data and data products, and driving better outcomes across their businesses with data.

RudderStack helps businesses make the most out of their customer data while ensuring data privacy and security. To learn more about RudderStack visit rudderstack.com.

  continue reading

442 פרקים

Artwork
iconשתפו
 
Manage episode 393293177 series 3264623
תוכן מסופק על ידי Rudderstack. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי Rudderstack או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.

Highlights from this week’s conversation include:

  • The role of an orchestrator in the lifecycle of data (1:34)
  • Relevance of orchestration in data pipelines (00:02:45)
  • Changes around data ops and MLOps (3:37)
  • Data Cleaning (11:42)
  • Overview of Dagster (13:50)
  • Assets vs Tasks in Data Pipeline (19:15)
  • Building a Data Pipeline with Dexter (25:40)
  • Difference between Data Asset and Materialized Dataset (28:28)
  • Defining Lineage and Data Assets in Dagster (29:32)
  • The boundaries of software and organizational structures (37:25)
  • The benefits of a unified orchestration framework (39:56)
  • Orchestration in the development phase (45:29)
  • The emergence of analytics engineer role (51:53)
  • Fluidity in data pipeline and infrastructure roles (52:40)

The Data Stack Show is a weekly podcast powered by RudderStack, the CDP for developers. Each week we’ll talk to data engineers, analysts, and data scientists about their experience around building and maintaining data infrastructure, delivering data and data products, and driving better outcomes across their businesses with data.

RudderStack helps businesses make the most out of their customer data while ensuring data privacy and security. To learn more about RudderStack visit rudderstack.com.

  continue reading

442 פרקים

כל הפרקים

×
 
Loading …

ברוכים הבאים אל Player FM!

Player FM סורק את האינטרנט עבור פודקאסטים באיכות גבוהה בשבילכם כדי שתהנו מהם כרגע. זה יישום הפודקאסט הטוב ביותר והוא עובד על אנדרואיד, iPhone ואינטרנט. הירשמו לסנכרון מנויים במכשירים שונים.

 

מדריך עזר מהיר

האזן לתוכנית הזו בזמן שאתה חוקר
הפעלה