양자화,quantization

w

통신에선

ML에선 보통 경량화/용량 줄이기/...를 위한 방법. 정밀도를 희생하고 성능/속도를 얻는다. ex.
{
모델 양자화 — FuriosaAI NPU 및 Software 문서 0.10.1 문서
https://furiosa-ai.github.io/docs/latest/ko/software/quantization.html#modelquantization

see also
성능 최적화 — FuriosaAI NPU 및 Software 문서 0.10.1 문서
https://furiosa-ai.github.io/docs/latest/ko/software/performance.html

}