model_int8_convert

Posted on 2019-07-25 | Edited on 2019-07-31 | Views:

遵循的几点准则：

对于weights的int8量化使用的是不饱和的方式；（ -|max| 和 |max| FP32 value 映射为 -127 和 127 ，中间值按照线性关系进行映射。）

对输入数据的int8量化使用的是饱和的量化方式。（即确定阈值 |T| ，将 ±|T| 映射为±127，这里 |T|<|max|。）

每一层的tensor 的 |T| 值都是不一样的。

确定每一层的 |T|值的过程称为校准（Calibration ）

您的鼓励是我持之以恒的动力

wei.cheng

软件工程师，IT行业从业数十载，聚焦计算机视觉应用，X86/ARM服务器后台，linux kernel存储驱动开发，曾在HW工作多年，现就职于Bitmain