OpenBMB 开源社区
/
BitCPM-CANN-3B-unquantized
like
0
添加到合集
文本生成
PyTorch
Transformers
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
0/100
全部分类
0
Label
状态
排序
讨论列表 - BitCPM-CANN-3B-unquantized:BitCPM-CANN-3B-unquantized 是 BitCPM-CANN-3B 的未量化量化感知训练(QAT)检查点,专为持续预训练和微调而设计。它保留了全精度的潜在权重,并通过 modeling.py 中定义的三元伪量化器(权重 → {-1, 0, 1},带分组缩放,通过 STE 训练),使模型能够在量化约束下继续学习。 - AtomGit AI社区