Fast visual discovery for photos, concepts, and creative inspiration.

Explore

Home
Discover Boards
Trending Search

Account

Sign In
Create Account
Saved Images
My Boards

© 2026 Mungart. All rights reserved.

Built for speed, clarity, and visual exploration.

…

Quantization Transformer

Family-friendly

SizeAspectAccentType

Showing 120 of 120on this page. Filters & sort apply to loaded results; URL updates for sharing.120 of 120 on this page

An example of mixed precision quantization of a Transformer LM using ...

Quantization of Transformer Models with Neural Compressor

Transformer Quantization at Darlene Stinson blog

Efficient 8-Bit Quantization of Transformer Neural Machine Language ...

Quantization of Transformer Models with Neural Compressor

Transformer Quantization at Darlene Stinson blog

Quantization of Transformer Models with Neural Compressor

Transformer Quantization at Darlene Stinson blog

(PDF) QUANTIZATION OF TRANSFORMER TRANSIENT WAVEFORMS UNDER NO-LOAD ...

Extremely Low Bit Transformer Quantization for On-Device NMT | PDF

(PDF) Understanding INT4 Quantization for Transformer Models: Latency ...

TSPTQ-ViT: TWO-SCALED POST-TRAINING QUANTIZATION FOR VISION TRANSFORMER ...

Transformer Quantization at Darlene Stinson blog

PoMQ-ViT: Mixed-Precision Quantization Vision Transformer with Pareto ...

Transformer Quantization at Darlene Stinson blog

Transformer Quantization at Darlene Stinson blog

Transformer Quantization at Darlene Stinson blog

Quantization of Transformer Models with Neural Compressor

Extremely Low Bit Transformer Quantization for On-Device NMT | PDF

Extremely Low Bit Transformer Quantization for On-Device NMT | PDF

PoMQ-ViT: Mixed-Precision Quantization Vision Transformer with Pareto ...

Extremely Low Bit Transformer Quantization for On-Device NMT | PDF

Transformer Quantization at Darlene Stinson blog

[论文评述] Mix-QViT: Mixed-Precision Vision Transformer Quantization Driven ...

Accelerate Vision Transformer (ViT) with Quantization using Optimum

Recent Trends in Transformer Quantization | by David Cochard | ailia ...

8-bit Quantization of Transformer Model - Speaker Deck

(PDF) Understanding INT4 Quantization for Transformer Models: Latency ...

Extremely Low Bit Transformer Quantization for On-Device NMT | PDF

Extremely Low Bit Transformer Quantization for On-Device NMT | PDF

[论文审查] Exploring Quantization for Efficient Pre-Training of Transformer ...

Efficient 8-Bit Quantization of Transformer Neural Machine Language ...

[2009.07453] Extremely Low Bit Transformer Quantization for On-Device ...

Extremely Low Bit Transformer Quantization for On-Device NMT | PDF

Understanding INT4 Quantization for Transformer Models: Latency Speedup ...

(PDF) Understanding INT4 Quantization for Transformer Models: Latency ...

Quantized General-Purpose Transformer

Fast and Accurate GPU Quantization for Transformers

Instance-Aware Group Quantization for Vision Transformers

Deciphering LLMs: From Transformers to Quantization - YouTube

VQ4DiT: A Fast Post-Training Vector Quantization Method for DiTs ...

Q-DiT: Accurate Post-Training Quantization for Diffusion Transformers

VIT quantization相关论文阅读_post-training quantization for vision ...

Figure 1 from Towards Accurate Post-Training Quantization for Vision ...

Large Transformer Model Inference Optimization | Lil'Log

Fast and Accurate GPU Quantization for Transformers

Exploring Bits-and-Bytes, AWQ, GPTQ, EXL2, and GGUF Quantization ...

Fast and Accurate GPU Quantization for Transformers

A Visual Guide to Quantization - by Maarten Grootendorst

AdaLog: Post-Training Quantization for Vision Transformers with ...

Fast and Accurate GPU Quantization for Transformers

Overview of natively supported quantization schemes in 🤗 Transformers

Speeding Up Transformer Training and Inference By Increasing Model Size ...

Fast and Accurate GPU Quantization for Transformers

Fast and Accurate GPU Quantization for Transformers

Transformer-VQ Linear-Time Transformers via Vector Quantization | PDF ...

(PDF) Q-DETR: An Efficient Low-Bit Quantized Detection Transformer

LLM Quantization with Hugging Face Transformers

Understanding and Overcoming the Challenges of Efficient Transformer ...

Quantization — Intel® Extension for Transformers 1.2 documentation

PTQ4ViT: Post-Training Quantization for Vision Transformers with Twin ...

[2305.17888] LLM-QAT: Data-Free Quantization Aware Training for Large ...

Table 2 from Fully Quantized Transformer for Improved Translation ...

Hierarchical Vector Quantized Transformer for Multi-class Unsupervised ...

[2111.12293] PTQ4ViT: Post-Training Quantization for Vision ...

Selectq Calibration Data Selection For Post-Training Quantization at ...

Fast and Accurate GPU Quantization for Transformers

[2506.11093] EfficientQuant: An Efficient Post-Training Quantization ...

Quantized Transformer Language Model Implementations on Edge Devices ...

Hierarchical Vector Quantized Transformer | Download Scientific Diagram

Mastering QLoRa : A Deep Dive into 4-Bit Quantization and LoRa ...

Fast and Accurate GPU Quantization for Transformers | Speechmatics

FQ-ViT: Post-Training Quantization for Fully Quantized Vision ...

Fast and Accurate GPU Quantization for Transformers

Fast and Accurate GPU Quantization for Transformers

Large Transformer Model Inference Optimization | Lil'Log

(PDF) Control and readout of current-induced magnetic flux quantization ...

Model Quantization with 🤗 Hugging Face Transformers and Bitsandbytes ...

Model Quantization with 🤗 Hugging Face Transformers and Bitsandbytes ...

Aespa: Towards Next-Level Post-Training Quantization of Hyper-Scale ...

ViDiT-Q: Efficient and Accurate Quantization of Diffusion Transformers ...

(PDF) Latency-Critical Quantized Inference With Transformer Decoders on ...

Quantized Transformer Export · Issue #4802 · onnx/onnx · GitHub

[논문 리뷰] VQ4DiT: Efficient Post-Training Vector Quantization for ...

Fast and Accurate GPU Quantization for Transformers | Speechmatics

Q-ViT: Accurate and Fully Quantized Low-bit Vision Transformer | DeepAI

Model Quantization with 🤗 Hugging Face Transformers and Bitsandbytes ...

How Quantization and Pruning Actually Work | by Zaina Haider | Nov ...

Overview of natively supported quantization schemes in 🤗 Transformers

Instance-Aware Group Quantization for Vision Transformers

FQ-ViT: Post-Training Quantization for Fully Quantized Vision ...

Q-ViT: Accurate and Fully Quantized Low-bit Vision Transformer | DeepAI

Fillable Online Hierarchical Vector Quantized Transformer for Multi ...

Quantization — Intel® Extension for Transformers 1.2 documentation

(PDF) GPTQ: Accurate Post-Training Quantization for Generative Pre ...

Quantization — Intel® Extension for Transformers 1.2 documentation

Overview of natively supported quantization schemes in 🤗 Transformers

Figure 4 from A Simplified Fully Quantized Transformer for End-to-end ...

Float Quantization at Sally Patrick blog

(PDF) Quantization of Vision Transformer-Based Model for Real-Time EEG ...

Fast and Accurate GPU Quantization for Transformers | Speechmatics

Understanding and Improving Knowledge Distillation for Quantization ...

Figure 1 from ITA: An Energy-Efficient Attention and Softmax ...

模型量化1-概述1：量化的过程就是选取合适量化参数（scale factor，zero point，clipping value）以及数据映射 ...

大模型入门指南 - Quantization：小白也能看懂的“模型量化”全解析_大模型量化-CSDN博客

transformer-quantization/main.py at main · Qualcomm-AI-research ...

SwiftTron: An Efficient Hardware Accelerator for Quantized Transformers ...

Understanding Quantization: Optimizing AI Models for Efficiency | by ...

Quantize 🤗 Transformers models

[2304.03986] SwiftTron: An Efficient Hardware Accelerator for Quantized ...

Table 2 from A 17–95.6 TOPS/W Deep Learning Inference Accelerator with ...

Figure 3 from LLM-FP4: 4-Bit Floating-Point Quantized Transformers ...

Figure 7 from LLM-FP4: 4-Bit Floating-Point Quantized Transformers ...

TransSMPL: Efficient Human Pose Estimation with Pruned and Quantized ...

LLM-FP4: 4-Bit Floating-Point Quantized Transformers - ACL Anthology

(PDF) Understanding and Overcoming the Challenges of Efficient ...

Unsupervised Semantic Scene Reconstruction via Transformer-Based ...

(PDF) Quantization-Aware and Tensor-Compressed Training of Transformers ...

TransSMPL: Efficient Human Pose Estimation with Pruned and Quantized ...

ViT-VQGAN：Vector-quantized Image Modeling with Improved VQGAN论文笔记 - 知乎

People also searched

Quantization Formula Quantization Diagram Vector Quantization Quantization Example Types of Quantization Quantized Signal Color Quantization Quantization Icon Quantization Graph Quantization Circuit Quantization Table Second Quantization Digital Signal Processing Quantization Error Examples Lloyd Max Quantizer Sampling Signal Scalar Quantization Quantization Ml Spectrum Quantization The Process of Quantization Sound Sampling Quantization Equation Quantized Energy Positronium Quantization Cartoon Discrete Signal Quantization Range Light Front Quantization Quantization of Waves Quantization Performance Graph Quantization Waveform Neuquant Noise Floor Quantization Grid Mid Tread Quantizer Tensor Quantization Thermal Noise Simple Quantization Diagrams Quantization Tensors Icons Quantization Graphics Designer Hierarchical Vector Quantization Mid Rise vs Mid Tread Quantizer Numerical Example of Quantization Quantization Error Chart Quantization Lane Compression Mesh Quantization Second Quantization Illustration Quantization Model Compression Linear Quantization Photoelectric Effect