归档 / 2026-06-02 / Cosmos3-Super-Text2Image (nvidia)

Cosmos3-Super-Text2Image (nvidia)

文本生成高保真图像,面向物理AI与创作

部署
  • vll vllm serve nvidia/Cosmos3-Super-Text2Image (vLLM-Omni)
  • py diffusers.Cosmos3OmniPipeline.from_pretrained()
  • dkr docker pull vllm/vllm-omni:cosmos3
入选理由
完备的推理接口(vLLM-Omni、Diffusers)可快速上手;但下载量低、无第三方评测,创新性一般,暂列观察。
对位
开源替代Flux、SD3等文生图模型
适合
物理世界场景生成 / 文本到高保真图像创作
不适合
安全关键任务与精确物理模拟
规模
64B · 4k tokens (文本输入) · Q4 ~43GB / FP16 ~155GB
授权
OpenMDW1.1 · 需自查
框架
vLLM-Omni / Diffusers / PyTorch
可信度
NVIDIA发布,64B参数,支持vLLM-Omni/Diffusers,经GB200/H100推理验证

评分详情

Q1
今天能接上用吗   5 / 5
Q2
有可信证据吗   1 / 5
Q3
是新东西吗   3 / 5
总分
9

HuggingFace 原始数据 (抓取于 2026-06-02)

作者
nvidia
任务类型
text-to-image
推理库
cosmos
下载
139
点赞
50
许可证
OpenMDW1.1
标签
cosmos, diffusers, safetensors, cosmos3_omni, nvidia, cosmos3, vllm-omni, text-to-image, image-generation, license:other, region:us

探索

源链接 ↗