归档 / 2026-05-31 / Step-3.7-Flash (StepFun)
Step-3.7-Flash (StepFun)
198B MoE视觉模型GGUF量化,适合128GB统一内存本地推理
- 部署
-
- py git clone https://github.com/stepfun-ai/llama.cpp && cd llama.cpp && git checkout step3.7 && cmake -B build && cmake --build build 复制
- py ./llama-server -m Step-3.7-flash-Q4_K_S.gguf --mmproj mmproj-Step-3.7-flash-f16.gguf -ngl 99 -c 32768 复制
- 入选理由
- 官方量化版,可本地运行多模态MoE模型,但缺乏第三方独立验证,建议观望。
- 对位
- 对位Qwen2.5-VL-72B或闭源视觉API
- 适合
- 本地私有化视觉问答与Agent工具调用 / 长上下文多模态理解与推理
- 不适合
- 低于64GB内存设备
- 规模
- 198B (激活11B) · 256k
- 授权
- Apache-2.0 · 需自查
- 框架
- llama.cpp (step3.7分支)
- 可信度
- 近30天下载2.9万次,Q4_K_S在M4 Max 262K上下文下生成9.7 t/s
评分详情
- Q1
- 今天能接上用吗 5 / 5
- Q2
- 有可信证据吗 3 / 5
- Q3
- 是新东西吗 1 / 5
- 总分
- 9
HuggingFace 原始数据 (抓取于 2026-05-31)
- 作者
- stepfun-ai
- 推理库
- gguf
- 下载
- 29,666
- 点赞
- 61
- 许可证
- Apache-2.0
- 标签
- gguf, llama.cpp, quantized, imatrix, moe, agent, tool-calling, reasoning, vision, multimodal, image-text-to-text, en, zh, ja, ko, ar, hi, de, fr, es, ru, base_model:stepfun-ai/Step-3.7-Flash, base_model:quantized:stepfun-ai/Step-3.7-Flash, license:apache-2.0, endpoints_compatible, region:us, conversational
探索
源链接 ↗