Atomgit-Ascend
/
GLM-5-w4a8
like
456
添加到合集
Transformers
Safetensors
MIT
NPU
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
返回讨论列表
仅管理员可管理讨论分类。
讨论分类列表 - GLM-5-w4a8:GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发 - AtomGit AI社区