Qwen3.6-27B-MTP-GGUF (Unsloth)
Qwen3.6-27B的MTP量化版,推理速度1.5-2倍提升
- 部署
-
- py llama.cpp llama-server -hf unsloth/Qwen3.6-27B-MTP-GGUF:UD-Q4_K_XL --spec-type draft-mtp
- py Unsloth Studio直接加载并交互
归档 / 2026-05-18 / Qwen3.6-27B-MTP-GGUF (Unsloth)
Qwen3.6-27B的MTP量化版,推理速度1.5-2倍提升
输入关键词,跨模型 / 数据集 / 空间 检索