模型归档 · 2026-05-29

8.3B (1.5B active)

端侧部署的混合MoE模型，用于工具调用与多语言助理

适合工具调用与结构化输出 / 多语言端侧个人助理

短板重编程或无检索的知识密集型问答

Q4 ~5.6GB / FP16 ~20GB · LFM1.0 (custom) · 131K · transformers需自查

证据107 赞 / 3 个社区来源

4B

1-bit量化文生图模型，专为Apple Silicon本地运行

适合Mac/iPhone/iPad本地生图 / 内存受限设备上运行扩散模型

短板高保真细节与复杂构图

4B · apache-2.0 · N/A · MLX可商用

证据15 赞 / 4 个社区来源

8B (激活 1B)

混合架构边缘语言模型，GGUF 量化，供 llama.cpp 部署

适合移动端/边缘设备文本生成 / 多语言轻量级本地部署

短板高精度复杂推理任务

8B (激活 1B) · other (lfm1.0) · 未知 · llama.cpp需自查

证据42 下载 / 60 赞 / 3 个社区来源

8.5B

零样本语音克隆多语言TTS模型，支持31种语言及显式暂停控制。

适合多语种有声内容生成 / 零样本个性化语音克隆

短板低延迟实时语音交互场景

Q4 ~5.6GB / FP16 ~20GB · Apache-2.0 · 未知 · transformers可商用

证据5447 下载 / 56 赞 / 4 个社区来源

4B

1.21GB三元文生图模型，4步采样，本地GPU运行

适合本地低显存GPU文生图创作 / 私有化部署与快速创意迭代

短板精细文字与严格构图约束

4B · Apache-2.0 · 不适用 · gemlite可商用

证据57 赞 / 3 个社区来源

4B

1.21GB 三元文生图扩散模型，苹果芯片本地运行

适合苹果芯片本地隐私图像生成 / 移动端快速创意迭代

短板精细文字、严格构图和细节要求高场景

4B · apache-2.0 · 不适用 · mlx可商用

证据36 赞 / 4 个社区来源

本期 (6)