此页是 2026-05-21 的观测快照,查看该模型当前信息 → /m/jackrong__qwopus35-9b-coder-mtp-gguf/

归档 / 2026-05-21 / Qwopus3.5-9B-Coder-MTP (Jackrong)

Qwopus3.5-9B-Coder-MTP (Jackrong)

9B多令牌预测代码模型，GGUF量化，面向代码推理

入选理由: GGUF格式可直接部署；MTP提升速度与准确率，属同系列微调。
对位: 对位 Qwen2.5-Coder-7B，强调MTP推理加速
适合: 本地代码生成与补全 / 高吞吐 Agent 代码推理
不适合: 长上下文推理或非量化高精度需求
规模: 9B · 128k
授权: apache-2.0 · 可商用
框架: llama.cpp / ollama / llama-cpp-python
血统: LoRA · 基于 Qwopus3.5-9B-v3.5
可信度: 下载量6680，点赞51；基于Qwen3.5-9B，MTP实测吞吐+35.8%

社区实测

社区用户反馈该模型比原版 Qwen3.5 9B 更稳定，在本地 agentic coding 场景下体验良好，但尚处早期测试阶段。

解决了原版 Qwen3.5 9B 在对话中频繁挂起、客户端断连的稳定性问题
为本地 9B 规模的 agentic coding 场景提供了一个可用的开源选择

最大上下文长度仅 260k，用户认为这是一个遗憾
社区测试仍处于早期阶段（用户称仅测试了几天），长期稳定性待观察

来源

Qwopus3.5 V3 is awsome for a local llm : r/LocalLLaMA - Reddit

截至 2026-06-19

快速上手示例

ollama run hf.co/Jackrong/Qwopus3.5-9B-Coder-MTP-GGUF:Q4_K_M

依赖版本和硬件参数请以源仓库说明为准。

评分详情

Q1: 今天能接上用吗 5 / 5
Q2: 有可信证据吗 1 / 5
Q3: 是新东西吗 3 / 5
总分: 9

HuggingFace 原始数据 (抓取于 2026-05-21)

作者: Jackrong
任务类型: text-generation
推理库: transformers
下载: 6,680
点赞: 51
许可证: apache-2.0
标签: transformers, gguf, text-generation-inference, unsloth, qwen3_5, reasoning, chain-of-thought, mtp, multi-token-prediction, speculative-decoding, lora, sft, agent, coder, text-generation, en, zh, ko, ru, ja, es, dataset:Jackrong/Claude-opus-4.7-TraceInversion-5000x, dataset:Jackrong/Claude-opus-4.6-TraceInversion-9000x, base_model:Jackrong/Qwopus3.5-9B-v3.5, base_model:adapter:Jackrong/Qwopus3.5-9B-v3.5, license:apache-2.0, endpoints_compatible, region:us, conversational

探索