归档 / 2026-05-20 / DeepSeek-V4-Flash-GGUF (antirez)
DeepSeek-V4-Flash-GGUF (antirez)
DS4引擎专用量化,128/256GB Mac本地推理
- 部署
-
- oll ollama run hf.co/antirez/deepseek-v4-gguf 复制
- py git clone https://github.com/antirez/ds4 && cd ds4 && ./download_model.sh q2 复制
- py ./ds4-server --ctx 100000 --kv-disk-dir /tmp/ds4-kv --kv-disk-space-mb 8192 复制
- 入选理由
- 有完整GGUF量化文件与ds4运行脚本,可快速试用;下载量大但缺乏第三方评测;仅量化重打包无新能力
- 对位
- 对位其他DeepSeek-V4的GGUF量化,专为ds4优化
- 适合
- 128/256 GB Mac本地运行DeepSeek V4 / MTP推测解码加速生成
- 不适合
- 非Apple Silicon或RAM<128GB
- 规模
- 未公开 · 100k
- 授权
- MIT
- 框架
- ds4 / llama.cpp
- 可信度
- 322k下载,149赞,作者antirez(Redis之父),量化配方透明
评分详情
- Q1
- 今天能接上用吗 5 / 5
- Q2
- 有可信证据吗 3 / 5
- Q3
- 是新东西吗 1 / 5
- 总分
- 9
HuggingFace 原始数据 (抓取于 2026-05-20)
- 作者
- antirez
- 推理库
- gguf
- 下载
- 322,696
- 点赞
- 149
- 许可证
- MIT
- 标签
- gguf, quantized, deepseek, deepseek-v4, deepseek-v4-flash, moe, mixture-of-experts, 2-bit, 4-bit, iq2_xxs, q2_k, q4_k, ds4, apple-silicon, metal, text-generation, en, base_model:deepseek-ai/DeepSeek-V4-Flash, base_model:quantized:deepseek-ai/DeepSeek-V4-Flash, license:mit, endpoints_compatible, region:us, conversational
探索
源链接 ↗