此页是 2026-06-03 的观测快照,查看该模型当前信息 → /m/jetbrains__mellum2-12b-a25b-thinking/

归档 / 2026-06-03 / Mellum2-12B-A2.5B-Thinking (JetBrains)

Mellum2-12B-A2.5B-Thinking (JetBrains)

思考型助手，在<think>块中输出推理链后给出最终答案

入选理由: 来源于JetBrains的MoE思考模型，推理能力较强，支持vLLM快速部署。
对位: 对位Qwen3.5与OLMo-3等开源推理模型
适合: 复杂代码调试与多步规划 / 数学竞赛与逻辑推理题
不适合: 低延迟闲聊或直接指令回答
规模: 12B · 131k · Q4 ~8GB / FP16 ~29GB
授权: Apache 2.0 · 可商用
框架: vllm / transformers
可信度: 在LiveCodeBench v6代码评测中pass@1达69.9%，在AIME 2025+2026数学评测均分58.4%

仅 safetensors · 无 pickle 加载风险

社区实测

12B MoE(2.5B 激活)推理速度快,编码接近 Qwen 3.5 9B,定位为系统内嵌快速组件而非前沿替代品

MoE 架构推理速度明显优于同规模稠密模型
编码能力接近 Qwen 3.5 9B 水平
商业、邮件、代码类任务综合评分扎实(8.62/10)

设计定位为系统内快速组件,非前沿模型替代品
复杂调试类任务对当前参数量仍有难度

来源

Mellum 2 12B A2.5B : r/LocalLLaMA a really good and performant model : r/LocalLLaMA r/LocalLLaMA - JetBrains open-sources Mellum2 - anyone tried these?JetBrains Releases Mellum2: A 12B MoE Model for Fast ... - Reddit

截至 2026-06-19

快速上手

vllm serve JetBrains/Mellum2-12B-A2.5B-Thinking --max-model-len 131072 --reasoning-parser qwen3

评分详情

Q1: 今天能接上用吗 4 / 5
Q2: 有可信证据吗 1 / 5
Q3: 是新东西吗 3 / 5
总分: 8

HuggingFace 原始数据 (抓取于 2026-06-03)

作者: JetBrains
任务类型: text-generation
推理库: transformers
下载: 799
点赞: 103
许可证: Apache 2.0
标签: transformers, safetensors, mellum, text-generation, conversational, en, arxiv:2605.31268, license:apache-2.0, model-index, eval-results, endpoints_compatible, region:us

探索