模型归档 · 2026-05-30 · SummFlow

模型 / 归档 / 2026-05-30

本期 (1)

Qwen3-TTS-12Hz-1.7B-CustomVoice (Qwen)

1.7B

指令式多语言TTS，流式延迟低至97ms，9音色

适合低延迟实时语音交互（端到端97ms） / 多语言指令式配音（9音色，10语种）

短板需语音克隆的场景（应使用Base模型）

Q4 ~1.3GB / FP16 ~4.6GB · Apache-2.0 · 未公开 · transformers可商用

证据1821.2k 下载 / 1548 赞 / 9 个社区来源

← 前一日 2026-05-29 · 后一日 2026-05-31 →