Qwen3.5-9B (Qwen)
Qwen3.5-9B MoQ量化版,MTP推测解码,适合本地快速生成
- 部署
-
- oll ollama run hf.co/w-ahmad/Qwen3.5-9B-GGUF-MoQ-MTP
- py llama.cpp: ./llama-cli -m Qwen3.5-9B-MoQ-4.85.gguf
- py llama-cpp-python: 直接加载 GGUF 文件进行推理
归档 / 2026-06-01 / Qwen3.5-9B (Qwen)
Qwen3.5-9B MoQ量化版,MTP推测解码,适合本地快速生成
输入关键词,跨模型 / 数据集 / 空间 检索