OpenBMB 开源社区
/
BitCPM-CANN-1B
like
0
添加到合集
文本生成
PyTorch
Transformers
英文
汉语
Apache License 2.0
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
已开启
0
已关闭
0
已合并
0
全部
0
创建者
合并人
排序
暂无数据
合并请求 - BitCPM-CANN-1B:BitCPM-CANN 是首个基于华为昇腾 NPU 原生构建的端到端 1.58 位(三值)大语言模型训练系统。该系统将量化感知训练(QAT)集成到 Megatron-LM 框架中,并结合 MindSpeed 加速技术,覆盖了从自定义三值算子到昇腾 910B 分布式并行训练的完整训练栈。 - AtomGit AI社区