归档 / 2026-05-21 / Qwopus3.5-9B-Coder-MTP (Jackrong)

Qwopus3.5-9B-Coder-MTP (Jackrong)

9B多令牌预测代码模型,GGUF量化,面向代码推理

部署
  • oll ollama run hf.co/Jackrong/Qwopus3.5-9B-Coder-MTP-GGUF:Q4_K_M
  • py llama.cpp: ./llama-cli -m qwopus3.5-9b-coder-mtp.Q4_K_M.gguf -ngl 99
  • py llama-cpp-python: Llama(model_path='<gguf-path>')
入选理由
Q1: GGUF格式可直接部署;Q2: 无第三方评测,主要为作者自证;Q3: MTP提升速度与准确率,但属同系列微调。
对位
对位 Qwen2.5-Coder-7B,强调MTP推理加速
适合
本地代码生成与补全 / 高吞吐 Agent 代码推理
不适合
长上下文推理或非量化高精度需求
规模
9B · 128k
授权
apache-2.0
框架
llama.cpp / ollama / llama-cpp-python
可信度
下载量6680,点赞51;基于Qwen3.5-9B,MTP实测吞吐+35.8%

评分详情

Q1
今天能接上用吗   5 / 5
Q2
有可信证据吗   1 / 5
Q3
是新东西吗   3 / 5
总分
9

HuggingFace 原始数据 (抓取于 2026-05-21)

作者
Jackrong
任务类型
text-generation
推理库
transformers
下载
6,680
点赞
51
许可证
apache-2.0
标签
transformers, gguf, text-generation-inference, unsloth, qwen3_5, reasoning, chain-of-thought, mtp, multi-token-prediction, speculative-decoding, lora, sft, agent, coder, text-generation, en, zh, ko, ru, ja, es, dataset:Jackrong/Claude-opus-4.7-TraceInversion-5000x, dataset:Jackrong/Claude-opus-4.6-TraceInversion-9000x, base_model:Jackrong/Qwopus3.5-9B-v3.5, base_model:adapter:Jackrong/Qwopus3.5-9B-v3.5, license:apache-2.0, endpoints_compatible, region:us, conversational

探索

源链接 ↗