归档 / 2026-05-20 / DeepSeek-V4-Flash-GGUF (antirez)

DeepSeek-V4-Flash-GGUF (antirez)

DS4引擎专用量化,128/256GB Mac本地推理

  • 已量化
部署
  • oll ollama run hf.co/antirez/deepseek-v4-gguf
  • py git clone https://github.com/antirez/ds4 && cd ds4 && ./download_model.sh q2
  • py ./ds4-server --ctx 100000 --kv-disk-dir /tmp/ds4-kv --kv-disk-space-mb 8192
入选理由
有完整GGUF量化文件与ds4运行脚本,可快速试用;下载量大但缺乏第三方评测;仅量化重打包无新能力
对位
对位其他DeepSeek-V4的GGUF量化,专为ds4优化
适合
128/256 GB Mac本地运行DeepSeek V4 / MTP推测解码加速生成
不适合
非Apple Silicon或RAM<128GB
规模
未公开 · 100k
授权
MIT
框架
ds4 / llama.cpp
可信度
322k下载,149赞,作者antirez(Redis之父),量化配方透明

评分详情

Q1
今天能接上用吗   5 / 5
Q2
有可信证据吗   3 / 5
Q3
是新东西吗   1 / 5
总分
9

HuggingFace 原始数据 (抓取于 2026-05-20)

作者
antirez
任务类型
text-generation
推理库
gguf
下载
322,696
点赞
149
许可证
MIT
标签
gguf, quantized, deepseek, deepseek-v4, deepseek-v4-flash, moe, mixture-of-experts, 2-bit, 4-bit, iq2_xxs, q2_k, q4_k, ds4, apple-silicon, metal, text-generation, en, base_model:deepseek-ai/DeepSeek-V4-Flash, base_model:quantized:deepseek-ai/DeepSeek-V4-Flash, license:mit, endpoints_compatible, region:us, conversational

探索

源链接 ↗