讨论列表 - BitCPM-CANN-1B:BitCPM-CANN 是首个基于华为昇腾 NPU 原生构建的端到端 1.58 位(三值)大语言模型训练系统。该系统将量化感知训练(QAT)集成到 Megatron-LM 框架中,并结合 MindSpeed 加速技术,覆盖了从自定义三值算子到昇腾 910B 分布式并行训练的完整训练栈。 - AtomGit AI社区