Artwork

תוכן מסופק על ידי HackerNoon. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי HackerNoon או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.
Player FM - אפליקציית פודקאסט
התחל במצב לא מקוון עם האפליקציה Player FM !

Instance-Aware Group Quantization for Vision Transformers

7:45
 
שתפו
 

Manage episode 520119224 series 3474385
תוכן מסופק על ידי HackerNoon. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי HackerNoon או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.

This story was originally published on HackerNoon at: https://hackernoon.com/instance-aware-group-quantization-for-vision-transformers.
A new PTQ method, IGQ-ViT, uses dynamic instance-aware grouping to quantize Vision Transformers efficiently without major accuracy loss.
Check more stories related to tech-stories at: https://hackernoon.com/c/tech-stories. You can also check exclusive content about #computer-vision-models, #vision-transformers, #post-training-quantization, #model-compression, #instance-aware-ai, #neural-network-efficiency, #low-bit-neural-networks, #igq-vit, and more.
This story was written by: @instancing. Learn more about this writer by checking @instancing's about page, and for more stories, please visit hackernoon.com.
Post-training quantization works well for CNNs but breaks down with Vision Transformers due to highly variable activation distributions. IGQ-ViT solves this by dynamically grouping channels per input instance so each group shares similar statistics, then quantizing them with shared parameters. The method also extends to softmax attention and includes a group-allocation strategy under BOP constraints. Across classification, detection, and segmentation tasks, IGQ-ViT delivers state-of-the-art quantization results for ViTs at low bit-widths without costly retraining.

  continue reading

372 פרקים

Artwork
iconשתפו
 
Manage episode 520119224 series 3474385
תוכן מסופק על ידי HackerNoon. כל תוכן הפודקאסטים כולל פרקים, גרפיקה ותיאורי פודקאסטים מועלים ומסופקים ישירות על ידי HackerNoon או שותף פלטפורמת הפודקאסט שלהם. אם אתה מאמין שמישהו משתמש ביצירה שלך המוגנת בזכויות יוצרים ללא רשותך, אתה יכול לעקוב אחר התהליך המתואר כאן https://he.player.fm/legal.

This story was originally published on HackerNoon at: https://hackernoon.com/instance-aware-group-quantization-for-vision-transformers.
A new PTQ method, IGQ-ViT, uses dynamic instance-aware grouping to quantize Vision Transformers efficiently without major accuracy loss.
Check more stories related to tech-stories at: https://hackernoon.com/c/tech-stories. You can also check exclusive content about #computer-vision-models, #vision-transformers, #post-training-quantization, #model-compression, #instance-aware-ai, #neural-network-efficiency, #low-bit-neural-networks, #igq-vit, and more.
This story was written by: @instancing. Learn more about this writer by checking @instancing's about page, and for more stories, please visit hackernoon.com.
Post-training quantization works well for CNNs but breaks down with Vision Transformers due to highly variable activation distributions. IGQ-ViT solves this by dynamically grouping channels per input instance so each group shares similar statistics, then quantizing them with shared parameters. The method also extends to softmax attention and includes a group-allocation strategy under BOP constraints. Across classification, detection, and segmentation tasks, IGQ-ViT delivers state-of-the-art quantization results for ViTs at low bit-widths without costly retraining.

  continue reading

372 פרקים

כל הפרקים

×
 
Loading …

ברוכים הבאים אל Player FM!

Player FM סורק את האינטרנט עבור פודקאסטים באיכות גבוהה בשבילכם כדי שתהנו מהם כרגע. זה יישום הפודקאסט הטוב ביותר והוא עובד על אנדרואיד, iPhone ואינטרנט. הירשמו לסנכרון מנויים במכשירים שונים.

 

מדריך עזר מהיר

האזן לתוכנית הזו בזמן שאתה חוקר
הפעלה