模型 / 归档 / 2026-05-28

本期 (1)

1B 模型 GGUF 量化,本地 agent 与边缘部署用

部署
  • oll ollama run hf.co/openbmb/MiniCPM5-1B-GGUF
  • py llama.cpp 直接加载 GGUF 文件运行
  • py 魔搭 ModelScope 下载 GGUF
入选理由
MiniCPM5-1B GGUF格式即下即用,1B参数长上下文+工具调用,多项优化达SOTA,推荐用于本地部署。
对位
对位 LFM2.5-1.2B / Qwen3.5-0.8B
适合
本地工具调用 agent / 边缘推理与桌面宠物
不适合
高吞吐量线上服务
规模
1B · 128k
授权
apache-2.0 · 需自查
框架
llama.cpp / ollama / LM Studio
可信度
RL+OPD 训练带来平均分 +16、超长回复率 ↓29pp;1B 级工具调用/推理 SOTA

← 前一日 2026-05-27 · 后一日 2026-05-29 →