Player FM - Internet Radio Done Right
159 subscribers
Checked 1M ago
הוסף לפני seven שנים
תוכן מסופק על ידי Hajime Morrita , Jun Mukai. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי Hajime Morrita , Jun Mukai או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.
Player FM - אפליקציית פודקאסט
התחל במצב לא מקוון עם האפליקציה Player FM !
התחל במצב לא מקוון עם האפליקציה Player FM !
#133: Triton: An Intermediate Language and Compiler for Tiled Neural Network Computations
Manage episode 419436258 series 2151064
תוכן מסופק על ידי Hajime Morrita , Jun Mukai. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי Hajime Morrita , Jun Mukai או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.
CUDA を書かずに済む GPU カーネルの DSL について森田が読みました。ご意見感想などは Reddit やおたより投書箱にお寄せください。iTunes のレビューや星もよろしくね。
- Triton: An Intermediate Language and Compiler for Tiled Neural Network Computations
- Introducing Triton: Open-source GPU programming for neural networks | OpenAI
- Welcome to Triton’s documentation! — Triton documentation
- Hello Triton.ipynb – Colab
- #01: Tensor Comprehensions, Rust Belt – Misreading Chat
- #23 – Halide: Decoupling Algorithms from Schedules for High-Performance Image Processing – Misreading Chat
- #27 – Julia: A Fresh Approach to Numerical Computing – Misreading Chat
147 פרקים
Manage episode 419436258 series 2151064
תוכן מסופק על ידי Hajime Morrita , Jun Mukai. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי Hajime Morrita , Jun Mukai או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.
CUDA を書かずに済む GPU カーネルの DSL について森田が読みました。ご意見感想などは Reddit やおたより投書箱にお寄せください。iTunes のレビューや星もよろしくね。
- Triton: An Intermediate Language and Compiler for Tiled Neural Network Computations
- Introducing Triton: Open-source GPU programming for neural networks | OpenAI
- Welcome to Triton’s documentation! — Triton documentation
- Hello Triton.ipynb – Colab
- #01: Tensor Comprehensions, Rust Belt – Misreading Chat
- #23 – Halide: Decoupling Algorithms from Schedules for High-Performance Image Processing – Misreading Chat
- #27 – Julia: A Fresh Approach to Numerical Computing – Misreading Chat
147 פרקים
כל הפרקים
×M
Misreading Chat


1 #143 – SWE-bench: Can Language Models Resolve Real-World GitHub Issues? 36:07
36:07
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי36:07
GitHub の Issue を読んでバグを直すエーアイについて森田が読みました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [2310.06770] SWE-bench: Can Language Models Resolve Real-World GitHub Issues? [2405.15793] SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering SWE-bench Introducing SWE-bench Verified | OpenAI The new Claude 3.5 Sonnet, Computer Use, and Building SOTA Agents — with Erik Schluntz, Anthropic…
M
Misreading Chat


1 #142: An Empirical Study of Rust-for-Linux: The Success, Dissatisfaction, and Compromise 54:05
54:05
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי54:05
Rust を Linux カーネルへで使う取り組みの進捗を 向井 がウォッチしました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 An Empirical Study of Rust-for-Linux: The Success, Dissatisfaction, and Compromise | USENIX Rust for Linux
M
Misreading Chat


1 #141: SQL Has Problems. We Can Fix Them: Pipe Syntax In SQL 36:55
36:55
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי36:55
Google SQL の新しい文法を森田が紹介しました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 SQL Has Problems. We Can Fix Them: Pipe Syntax In SQL PRQL Pipe syntax | BigQuery | Google Cloud SQLite Forum: Interesting paper from Google on pipe syntax on SQL
M
Misreading Chat


1 #140: GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models 39:54
39:54
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי39:54
LLM にひっかけ算数問題を出してみる話を 向井 が読みました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [2410.05229] GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models GitHub – openai/grade-school-math
M
Misreading Chat


1 #139: NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis 38:00
38:00
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי38:00
写真を集めてシーンをレンダリングするニューラルネットを森田が読みました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis NeRF Tutorial ECCV 2022 illuminate.google.com
M
Misreading Chat


1 #138: Distilling the Knowledge in a Neural Network 23:38
23:38
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי23:38
大きなモデルから小さなモデルを作るテクニックを 向井 が回願しました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [1503.02531] Distilling the Knowledge in a Neural Network
M
Misreading Chat


1 #137: Optimal Quantile Approximation in Streams 27:32
27:32
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי27:32
ストリームにパーセンタイルを計算したい森田が教科書を読みました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [1603.05346v2] Optimal Quantile Approximation in Streams Small Summaries for Big Data Data Types – Presto 0.288 Documentation Estimating Percentile Values | Snowflake Documentation KLL sketch vs t-digest – DataSketches…
M
Misreading Chat


1 #136: Distinct Elements in Streams: An Algorithm for the (Text) Book 25:58
25:58
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי25:58
学部生にも実装できるストリームの要素カウントアルゴリズムを 向井 が試しました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [2301.10191] Distinct Elements in Streams: An Algorithm for the (Text) Book The CVM Algorithm for Estimating Distinct Elements in Streams Computer scientists invent an efficient new way to count | Hacker News…
M
Misreading Chat


1 #135: In-Datacenter Performance Analysis of a Tensor Processing Unit 44:18
44:18
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי44:18
行列の掛け算が得意なハードウェアについて森田が読みました。ご意見感想などは Reddit やおたより投書箱にお寄せください。iTunes のレビューや星もよろしくね。 [1704.04760] In-Datacenter Performance Analysis of a Tensor Processing Unit Systolic Arrays – an overview | ScienceDirect Topics Pallas: a JAX kernel language — JAX documentation About Groq – Fast AI Inference The Design Process for Google’s Training Chips: TPUv2 and TPUv3 | IEEE Journals & Magazine | IEEE Xplore…
M
Misreading Chat


1 #134: LoRA: Low-Rank Adaptation of Large Language Models 28:40
28:40
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי28:40
巨大 ML モデルの軽量 fine-tuning 手法を 向井 が読みました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [2106.09685] LoRA: Low-Rank Adaptation of Large Language Models
M
Misreading Chat


1 #133: Triton: An Intermediate Language and Compiler for Tiled Neural Network Computations 30:19
30:19
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי30:19
CUDA を書かずに済む GPU カーネルの DSL について森田が読みました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 Triton: An Intermediate Language and Compiler for Tiled Neural Network Computations Introducing Triton: Open-source GPU programming for neural networks | OpenAI Welcome to Triton’s documentation! — Triton documentation Hello Triton.ipynb – Colab #01: Tensor Comprehensions, Rust Belt – Misreading Chat #23 – Halide: Decoupling Algorithms from Schedules for High-Performance Image Processing – Misreading Chat #27 – Julia: A Fresh Approach to Numerical Computing – Misreading Chat…
M
Misreading Chat


1 #132: High-Resolution Image Synthesis with Latent Diffusion Models 34:30
34:30
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי34:30
Stable Diffusion の元論文を 向井 が読みました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [2112.10752] High-Resolution Image Synthesis with Latent Diffusion Models [2105.05233] Diffusion Models Beat GANs on Image Synthesis Classifier-Free Diffusion Guidance | OpenReview What are Diffusion Models? | Lil’Log…
M
Misreading Chat


1 #131: FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness 30:40
30:40
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי30:40
CUDA で書かれた PyTorch 用カーネルに森田が玉砕しました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 [2205.14135] FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness GitHub – Dao-AILab/flash-attention: Fast and memory-efficient exact attention GitHub – NVIDIA/apex: A PyTorch Extension: Tools for easy mixed precision and distributed training in Pytorch [2307.08691] FlashAttention-2: Faster Attention with Better Parallelism and Work Partitioning [2112.05682] Self-attention Does Not Need $O(n^2)$ Memory GitHub – tspeterkim/flash-attention-minimal: Flash Attention in ~100 lines of CUDA (forward pass only)…
M
Misreading Chat


1 #130: Diffusion models from scratch, from a new theoretical perspective 30:44
30:44
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי30:44
向井 が画像生成の拡散モデルに入門しました。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 Diffusion models from scratch [1503.03585] Deep Unsupervised Learning using Nonequilibrium Thermodynamics [2006.11239] Denoising Diffusion Probabilistic Models
M
Misreading Chat


1 #129: Programming Massively Parallel Processors (Ch.4- Ch.6) 59:43
59:43
הפעל מאוחר יותר
הפעל מאוחר יותר
רשימות
לייק
אהבתי59:43
森田が飽きずに CUDA の教科書を読んでます。ご意見感想などは Reddit や おたより投書箱 にお寄せください。 iTunes のレビューや星 もよろしくね。 Programming Massively Parallel Processors: A Hands-on Approach ( Amazon.co.jp , Elsevier ) NVIDIA H100 Tensor Core GPU Architecture Overview
ברוכים הבאים אל Player FM!
Player FM סורק את האינטרנט עבור פודקאסטים באיכות גבוהה בשבילכם כדי שתהנו מהם כרגע. זה יישום הפודקאסט הטוב ביותר והוא עובד על אנדרואיד, iPhone ואינטרנט. הירשמו לסנכרון מנויים במכשירים שונים.