模型归档 · 2026-05-20

Bonsai-8B-mlx-1bit (PrismML)

8B

Apple Silicon 的 1-bit LLM，端侧极低内存推理

Apple Silicon

适合iPhone/Mac 本地隐私推理 / 移动端及边缘低功耗部署

短板需全精度浮点的高敏感任务

Q4 ~0.3GB / FP16 ~0.9GB · Apache-2.0 · 65k · mlx可商用

证据15k 下载 / 206 赞 / 4 个社区来源

SuperGemma4-26B (Jiunsong)

26B (4-bit)

Gemma4 26B 无审查 MLX, 本地代理加速

Apple Silicon
已量化

适合代码与工具使用代理 / 无审查对话与指令跟随

短板视觉或多模态任务

Q4 ~17GB / FP16 ~61GB · gemma · 未知 · mlx限制商用

证据25.7k 下载 / 236 赞 / 9 个社区来源

XEUS (CMU WAVLab)

577M

覆盖4000+语言的语音基础模型，供ASR/翻译微调

Apple Silicon

适合多语言语音识别微调 / 语音翻译与语音tokenization

短板不微调直接用于生产ASR

577M · CC BY-NC-SA 4.0 · 未知 · espnet不可商用

证据149 下载 / 148 赞 / 2 个社区来源

Whisper Large v3 MLX (mlx-community)

1.55B

Apple Silicon 上运行的 Whisper 语音识别模型

Apple Silicon

适合Mac 本地离线语音转录 / 与 MLX 生态无缝集成

短板非 Apple Silicon 设备

1.55B · MIT · 30s 音频片段 · mlx可商用

证据151.4k 下载 / 81 赞 / 3 个社区来源

Minimalism (salakash)

0.5B

为开发者输出最少代码行的可运行代码

Apple Silicon

适合输出最少代码行的可运行代码 / Apple Silicon本地推理

短板非Python或复杂软件项目

0.5B · Apache-2.0 · 32k · mlx-lm可商用

证据437 下载 / 187 赞 / 5 个社区来源

HRM-Text-1B (sapientinc)

1B

1B预对齐前缀LM，用前缀条件做结构化输出与推理

适合Few-shot 直接答案提取（direct前缀） / 复合条件 CoT 推理（synth,cot前缀）

短板聊天对话与代码生成

Q4 ~0.8GB / FP16 ~2.8GB · Apache-2.0 · 4096 · transformers可商用

证据884 下载 / 112 赞 / 2 个社区来源

Whisper-large-v3-turbo (mlx-community)

809M

Mac端Whisper large-v3-turbo，MLX低延迟转写

Apple Silicon

适合Mac本地离线语音转写 / 低延迟实时字幕生成

短板非Apple Silicon设备

809M · unknown · 30s · mlx

证据32.7k 下载 / 93 赞 / 4 个社区来源

LTX-2.3-Workflows (RuneXX)

未公开

LTX-2.3模型的ComfyUI工作流集合，用于图像/视频生成。

适合快速搭建图像/视频到视频流水线 / image-to-video等多媒体生成任务

短板不使用ComfyUI的纯脚本生成

未公开 · unknown · 未知 · ComfyUI

证据589 赞 / 4 个社区来源

本期 (8)