1B 模型 GGUF 量化,本地 agent 与边缘部署用
- 部署
-
- oll ollama run hf.co/openbmb/MiniCPM5-1B-GGUF 复制
- py llama.cpp 直接加载 GGUF 文件运行 复制
- py 魔搭 ModelScope 下载 GGUF 复制
- 入选理由
- MiniCPM5-1B GGUF格式即下即用,1B参数长上下文+工具调用,多项优化达SOTA,推荐用于本地部署。
- 对位
- 对位 LFM2.5-1.2B / Qwen3.5-0.8B
- 适合
- 本地工具调用 agent / 边缘推理与桌面宠物
- 不适合
- 高吞吐量线上服务
- 规模
- 1B · 128k
- 授权
- apache-2.0 · 需自查
- 框架
- llama.cpp / ollama / LM Studio
- 可信度
- RL+OPD 训练带来平均分 +16、超长回复率 ↓29pp;1B 级工具调用/推理 SOTA