归档 / 2026-05-21 / Nemotron-3-Nano-Omni-30B-A3B (NVIDIA)

Nemotron-3-Nano-Omni-30B-A3B (NVIDIA)

NVIDIA 多模态推理模型 GGUF 量化版,本地推理用

部署
  • py LM Studio 搜索 Nemotron-3-Nano-Omni 一键下载
  • py llama.cpp 运行: ./llama-cli -m <gguf-file>
入选理由
GGUF格式可直接在LM Studio/Ollama本地运行,下载量高但仅量化版本,无新能力
对位
对位 3B 激活量的推理模型
适合
本地多模态对话 / 图像理解与推理
不适合
生产级高并发推理
规模
30B (3B 激活) · 未知
授权
NVIDIA Open Model Agreement
框架
llama.cpp / ollama / lm-studio
可信度
HuggingFace 168900 下载,LM Studio 社区精选

评分详情

Q1
今天能接上用吗   5 / 5
Q2
有可信证据吗   3 / 5
Q3
是新东西吗   1 / 5
总分
9

HuggingFace 原始数据 (抓取于 2026-05-21)

作者
lmstudio-community
任务类型
unknown
推理库
未指定
下载
168,900
点赞
8
许可证
NVIDIA Open Model Agreement
标签
gguf, nvidia, multimodal, base_model:nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-BF16, base_model:quantized:nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-BF16, license:other, endpoints_compatible, region:us, conversational

探索

源链接 ↗