

成都康喬核心技術(shù)攻關(guān)
成都康喬電子KQ-NADS提供一種基于CNN的低精度訓練與8位整型量化推理方法,主要步驟為:
低精度模型訓練;用16位浮點型的低精度定點算法進行模型訓練,得到用于目標檢測的模型;量化權(quán)重;提出8位整型量化方案,按層將卷積神經(jīng)網(wǎng)絡的權(quán)重參數(shù)從16位浮點型量化為8位整型;8位整型量化推理;把激活值量化為8位整型數(shù)據(jù),即CNN的每一層都接受int8類型量化輸入并生成int8量化輸出。
用16位浮點型低精度定點算法訓練模型得到權(quán)重,再量化為8位的整型數(shù)據(jù)進行前向推理,相比于32位浮點型算法訓練模型得到的權(quán)重直接進行8位整型量化推理,優(yōu)化卷積層的推理過程,有效降低了低位定點量化推理帶來的精度損失。
