NAVA (Baidu)
6.3B 文本生成同步音视频,支持多说话人音色控制
- 部署
-
- hf huggingface-cli download <repo-id> 后 bash scripts/inference.sh
- py torchrun 自定义 JSONL 推理,支持 8 卡 Ulysses 并行
- py Gradio Web UI: bash gradio_demo/start_gradio.sh
归档 / 2026-06-02 / NAVA (Baidu)
6.3B 文本生成同步音视频,支持多说话人音色控制
输入关键词,跨模型 / 数据集 / 空间 检索