模型归档 · 2026-05-31

35B (激活3B)

Qwen3.6-35B-A3B FP4量化版，面向vLLM高效推理

适合AI Agent系统 / RAG与聊天机器人

短板有毒提示或偏见内容生成

Q4 ~12GB / FP16 ~45GB · Apache 2.0 · 262k · vllm可商用

证据67k 下载 / 46 赞 / 12 个社区来源

本期 (1)