Qwen3.5-397B-A17B (Qwen)
本地运行 397B MoE 多模态,GGUF 量化 + MTP 加速
- 部署
-
- py llama.cpp: ./llama-cli -m Qwen3.5-397B-A17B-Q4_K_M.gguf --spec-type draft-mtp --spec-draft-model ./mtp-Qwen_Qwen3.5-397B-A17B-Q8_0.gguf
- py LM Studio: 搜索 bartowski Qwen3.5-397B-A17B 直接下载
- hf huggingface-cli download bartowski/Qwen_Qwen3.5-397B-A17B-GGUF --include 'Qwen3.5-397B-A17B-Q4_K_M.gguf' --local-dir ./