归档 / 2026-05-29 / MOSS-TTS-v1.5 (OpenMOSS)
MOSS-TTS-v1.5 (OpenMOSS)
零样本语音克隆多语言TTS模型,支持31种语言及显式暂停控制。
- 部署
-
- py git clone https://github.com/OpenMOSS/MOSS-TTS.git && pip install -e . 复制
- py transformers.AutoModel.from_pretrained('OpenMOSS-Team/MOSS-TTS-v1.5') 复制
- 入选理由
- 需自行部署推理代码,但示例清晰;社区证据有限(仅论文和GitHub);相比1.0版本有质量改进和新增语言支持。
- 对位
- 对位CosyVoice、FishSpeech等开源TTS
- 适合
- 多语种有声内容生成 / 零样本个性化语音克隆
- 不适合
- 低延迟实时语音交互场景
- 规模
- 8.5B · 未知 · Q4 ~5.6GB / FP16 ~20GB
- 授权
- Apache-2.0 · 需自查
- 框架
- transformers
- 可信度
- 论文arxiv 2603.18090,ModelScope可访问,支持31种语言零样本克隆。
评分详情
- Q1
- 今天能接上用吗 3 / 5
- Q2
- 有可信证据吗 1 / 5
- Q3
- 是新东西吗 3 / 5
- 总分
- 7
HuggingFace 原始数据 (抓取于 2026-05-29)
- 作者
- OpenMOSS-Team
- 推理库
- 未指定
- 下载
- 5,447
- 点赞
- 56
- 许可证
- Apache-2.0
- 标签
- safetensors, moss_tts_delay, text-to-speech, custom_code, zh, yue, en, ar, cs, da, de, nl, es, fr, fi, el, he, hi, hu, ja, it, ko, mk, ms, ru, fa, pl, pt, sv, ro, sw, tl, th, tr, vi, arxiv:2603.18090, license:apache-2.0, region:us
探索
源链接 ↗