Ascend-SACT
/
GPT-OSS-20B-BF16-based-vllm-ascend
like
0
添加到合集
汉语
Apache License 2.0
NPU
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
已开启
0
已关闭
0
已合并
0
全部
0
创建者
合并人
排序
暂无数据
合并请求 - GPT-OSS-20B-BF16-based-vllm-ascend:针对GPT-OSS模型在昇腾NPU上的推理部署,通过融合算子适配、MoE断点补齐及图模式优化,显著降低时延并提升TPS,精度误差在可接受范围。【此简介由AI生成】 - AtomGit AI社区