归档 / 2026-06-03 / Mellum2-12B-A2.5B-Thinking (JetBrains)

Mellum2-12B-A2.5B-Thinking (JetBrains)

思考型助手,在<think>块中输出推理链后给出最终答案

部署
  • vll vllm serve JetBrains/Mellum2-12B-A2.5B-Thinking --max-model-len 131072 --reasoning-parser qwen3
  • py transformers.AutoModelForCausalLM.from_pretrained("JetBrains/Mellum2-12B-A2.5B-Thinking")
入选理由
来源于JetBrains的MoE思考模型,推理能力较强,支持vLLM快速部署;但缺乏第三方验证,社区热度低。
对位
对位Qwen3.5与OLMo-3等开源推理模型
适合
复杂代码调试与多步规划 / 数学竞赛与逻辑推理题
不适合
低延迟闲聊或直接指令回答
规模
12B · 131k · Q4 ~8GB / FP16 ~29GB
授权
Apache 2.0 · 需自查
框架
vllm / transformers
可信度
在LiveCodeBench v6代码评测中pass@1达69.9%,在AIME 2025+2026数学评测均分58.4%

评分详情

Q1
今天能接上用吗   4 / 5
Q2
有可信证据吗   1 / 5
Q3
是新东西吗   3 / 5
总分
8

HuggingFace 原始数据 (抓取于 2026-06-03)

作者
JetBrains
任务类型
text-generation
推理库
transformers
下载
799
点赞
103
许可证
Apache 2.0
标签
transformers, safetensors, mellum, text-generation, conversational, en, arxiv:2605.31268, license:apache-2.0, model-index, eval-results, endpoints_compatible, region:us

探索

源链接 ↗