BitCPM-CANN-8B (OpenBMB)
昇腾原生1.58-bit三元LLM,推理内存降6x,保持95.7%性能
- 部署
-
- py transformers: AutoModelForCausalLM.from_pretrained('openbmb/BitCPM-CANN-8B')
- oll ollama create 从 https://huggingface.co/openbmb/BitCPM-CANN-8B-gguf 导入
归档 / 2026-05-27 / BitCPM-CANN-8B (OpenBMB)
昇腾原生1.58-bit三元LLM,推理内存降6x,保持95.7%性能
输入关键词,跨模型 / 数据集 / 空间 检索