Nemotron-Labs-Diffusion-14B (NVIDIA) 三模式 LM (AR/扩散/自推测),为 AI 应用开发者提供高效生成 部署 py transformers from_pretrained() 复制 入选理由有推理代码但无现成接口;仅官方宣传;模型架构创新 对位对位 Qwen3-8B / Eagle3 适合高吞吐对话生成(自推测解码) / 边缘设备单用户加速推理(DGX Spark) 不适合长文本场景(上下文长度未公开) 规模14B · 未知 授权NVIDIA Nemotron Open Model License 框架transformers 可信度自推测接受长度 3× vs Qwen3-8B-Eagle3,DGX Spark 上 2.7× 加速 (w4a16)