归档 / 2026-05-21 / Qwopus3.5-9B-Coder-MTP (Jackrong)
Qwopus3.5-9B-Coder-MTP (Jackrong)
9B多令牌预测代码模型,GGUF量化,面向代码推理
- 部署
-
- oll ollama run hf.co/Jackrong/Qwopus3.5-9B-Coder-MTP-GGUF:Q4_K_M 复制
- py llama.cpp: ./llama-cli -m qwopus3.5-9b-coder-mtp.Q4_K_M.gguf -ngl 99 复制
- py llama-cpp-python: Llama(model_path='<gguf-path>') 复制
- 入选理由
- Q1: GGUF格式可直接部署;Q2: 无第三方评测,主要为作者自证;Q3: MTP提升速度与准确率,但属同系列微调。
- 对位
- 对位 Qwen2.5-Coder-7B,强调MTP推理加速
- 适合
- 本地代码生成与补全 / 高吞吐 Agent 代码推理
- 不适合
- 长上下文推理或非量化高精度需求
- 规模
- 9B · 128k
- 授权
- apache-2.0
- 框架
- llama.cpp / ollama / llama-cpp-python
- 可信度
- 下载量6680,点赞51;基于Qwen3.5-9B,MTP实测吞吐+35.8%
评分详情
- Q1
- 今天能接上用吗 5 / 5
- Q2
- 有可信证据吗 1 / 5
- Q3
- 是新东西吗 3 / 5
- 总分
- 9
HuggingFace 原始数据 (抓取于 2026-05-21)
- 作者
- Jackrong
- 推理库
- transformers
- 下载
- 6,680
- 点赞
- 51
- 许可证
- apache-2.0
- 标签
- transformers, gguf, text-generation-inference, unsloth, qwen3_5, reasoning, chain-of-thought, mtp, multi-token-prediction, speculative-decoding, lora, sft, agent, coder, text-generation, en, zh, ko, ru, ja, es, dataset:Jackrong/Claude-opus-4.7-TraceInversion-5000x, dataset:Jackrong/Claude-opus-4.6-TraceInversion-9000x, base_model:Jackrong/Qwopus3.5-9B-v3.5, base_model:adapter:Jackrong/Qwopus3.5-9B-v3.5, license:apache-2.0, endpoints_compatible, region:us, conversational
探索
源链接 ↗