Granite-4.1-8B-GGUF (IBM) IBM Granite 4.1 8B的GGUF量化,用于本地推理 部署 py 在LM Studio中搜索'granite-4.1-8b-GGUF'下载加载 复制 py llama.cpp -m granite-4.1-8b.gguf 复制 入选理由GGUF格式可直接运行,但缺乏第三方评测,本质是量化重打包 对位对位 Llama-3.1-8B 适合本地CPU推理 / 低资源设备文本生成 不适合高并发生产环境 规模8B · 未知 授权apache-2.0 框架llama.cpp / LM Studio / ollama 可信度HF下载1015,由LM Studio使用llama.cpp b8994量化