模型归档 · 2026-06-01 · SummFlow

模型 / 归档 / 2026-06-01

本期 (1)

Qwen3.5-9B (Qwen)

9B

Qwen3.5-9B MoQ量化版，MTP推测解码，适合本地快速生成

适合本地内存受限下的9B模型推理 / 利用MTP推测解码加速文本生成

短板追求极致精度或官方全量模型的任务

9B · MIT · 32k · llama.cpp可商用

证据6044 下载 / 11 个社区来源

← 前一日 2026-05-31 · 后一日 2026-06-02 →