meituan-longcat
/
LongCat-Video-Avatar-1.5
like
55
添加到合集
自动语音识别
PyTorch
Transformers
Diffusers
ONNX
Safetensors
JAX
98 languages
Apache License 2.0
hf-asr-leaderboard
audio
arxiv:2212.04356
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
0/100
全部分类
0
Label
状态
排序
讨论列表 - LongCat-Video-Avatar-1.5:最新开源LongCat-Video-Avatar 1.5 版本,这是一款经过升级的开源框架,专注于音频驱动人物视频生成的极致实证优化与生产级就绪能力。该版本在 LongCat-Video 基础模型之上构建,可生成高度稳定的商用级虚拟人视频,支持音频-文本转视频(AT2V)、音频-文本-图像转视频(ATI2V)以及视频续播等原生任务,并能无缝兼容单流与多流音频输入。 - AtomGit AI社区