模型归档 · 2026-06-03

模型 / 归档 / 2026-06-03

本期 (2)

8.3B (1.5B active)

8.3B总参/1.5B活跃，面向端侧个人助手的混合架构模型

适合端侧个人助理及工具调用 / 多语言指令跟随与结构化输出

短板重度编程及无检索知识问答

8.3B (1.5B active) · LFM1.0 · 128k · llama.cpp需自查

证据29.5k 下载 / 47 赞 / 2 个社区来源

12B

思考型助手，在<think>块中输出推理链后给出最终答案

适合复杂代码调试与多步规划 / 数学竞赛与逻辑推理题

短板低延迟闲聊或直接指令回答

Q4 ~8GB / FP16 ~29GB · Apache 2.0 · 131k · vllm可商用

证据799 下载 / 103 赞 / 4 个社区来源