归档 / 2026-05-29 / MOSS-TTS-v1.5 (OpenMOSS)

MOSS-TTS-v1.5 (OpenMOSS)

零样本语音克隆多语言TTS模型,支持31种语言及显式暂停控制。

部署
  • py git clone https://github.com/OpenMOSS/MOSS-TTS.git && pip install -e .
  • py transformers.AutoModel.from_pretrained('OpenMOSS-Team/MOSS-TTS-v1.5')
入选理由
需自行部署推理代码,但示例清晰;社区证据有限(仅论文和GitHub);相比1.0版本有质量改进和新增语言支持。
对位
对位CosyVoice、FishSpeech等开源TTS
适合
多语种有声内容生成 / 零样本个性化语音克隆
不适合
低延迟实时语音交互场景
规模
8.5B · 未知 · Q4 ~5.6GB / FP16 ~20GB
授权
Apache-2.0 · 需自查
框架
transformers
可信度
论文arxiv 2603.18090,ModelScope可访问,支持31种语言零样本克隆。

评分详情

Q1
今天能接上用吗   3 / 5
Q2
有可信证据吗   1 / 5
Q3
是新东西吗   3 / 5
总分
7

HuggingFace 原始数据 (抓取于 2026-05-29)

作者
OpenMOSS-Team
任务类型
text-to-speech
推理库
未指定
下载
5,447
点赞
56
许可证
Apache-2.0
标签
safetensors, moss_tts_delay, text-to-speech, custom_code, zh, yue, en, ar, cs, da, de, nl, es, fr, fi, el, he, hi, hu, ja, it, ko, mk, ms, ru, fa, pl, pt, sv, ro, sw, tl, th, tr, vi, arxiv:2603.18090, license:apache-2.0, region:us

探索

源链接 ↗