Mellum2-12B-A2.5B-Thinking (JetBrains)
思考型助手,在<think>块中输出推理链后给出最终答案
- 部署
-
- vll vllm serve JetBrains/Mellum2-12B-A2.5B-Thinking --max-model-len 131072 --reasoning-parser qwen3 复制
- py transformers.AutoModelForCausalLM.from_pretrained("JetBrains/Mellum2-12B-A2.5B-Thinking") 复制
- 入选理由
- 来源于JetBrains的MoE思考模型,推理能力较强,支持vLLM快速部署;但缺乏第三方验证,社区热度低。
- 对位
- 对位Qwen3.5与OLMo-3等开源推理模型
- 适合
- 复杂代码调试与多步规划 / 数学竞赛与逻辑推理题
- 不适合
- 低延迟闲聊或直接指令回答
- 规模
- 12B · 131k · Q4 ~8GB / FP16 ~29GB
- 授权
- Apache 2.0 · 需自查
- 框架
- vllm / transformers
- 可信度
- 在LiveCodeBench v6代码评测中pass@1达69.9%,在AIME 2025+2026数学评测均分58.4%