任务类型 · text-generation

共 28 个 (跨 13 天)

2026-06-03

Mellum2-12B-A2.5B-Thinking (JetBrains) 思考型助手,在<think>块中输出推理链后给出最终答案 LFM2.5-8B-A1B (Liquid AI) 8.3B总参/1.5B活跃,面向端侧个人助手的混合架构模型

2026-06-01

Qwen3.5-9B (Qwen) Qwen3.5-9B MoQ量化版,MTP推测解码,适合本地快速生成

2026-05-31

Qwen3.6-35B-A3B-NVFP4 (NVIDIA) Qwen3.6-35B-A3B FP4量化版,面向vLLM高效推理

2026-05-29

LFM2.5-8B-A1B (LiquidAI) 混合架构边缘语言模型,GGUF 量化,供 llama.cpp 部署 LFM2.5-8B-A1B (LiquidAI) 端侧部署的混合MoE模型,用于工具调用与多语言助理

2026-05-28

MiniCPM5-1B-GGUF (OpenBMB) 1B 模型 GGUF 量化,本地 agent 与边缘部署用

2026-05-27

MiMo-V2.5 Coder Q2 (Xiaomi) 128GB Mac本地编码与工具调用GGUF BitCPM-CANN-8B (OpenBMB) 昇腾原生1.58-bit三元LLM,推理内存降6x,保持95.7%性能

2026-05-26

aro-coder-4bit (ARO-Lang) 为ARO语言微调的代码生成器,4bit量化,供ARO DSL开发者使用 MiniCPM5-1B (OpenBMB) 1B 端侧模型,工具调用与混合推理

2026-05-24

Qwopus3.6-27B-v2-MTP-GGUF (Jackrong) 多Token预测推理模型,面向编码、数学、DevOps开发者 Qwen3.6-27B (OBLITERATUS) 移除拒绝回路,能力保持,本地全栈部署

2026-05-22

Meta-Llama-3-8B-Instruct-4bit (mlx-community) Llama-3-8B 4-bit版,M系列芯片本地推理 Ternary-Bonsai-8B (Prism ML) 三元1.58-bit量化8B模型,苹果芯片本地推理

2026-05-21

Qwopus3.5-9B-Coder-MTP (Jackrong) 9B多令牌预测代码模型,GGUF量化,面向代码推理 Llama-2-7b-chat-mlx (mlx-community) Apple芯片上本地运行的Llama2 7B对话模型 Nemotron-Labs-Diffusion-14B (NVIDIA) 三模式 LM (AR/扩散/自推测),为 AI 应用开发者提供高效生成

2026-05-20

SuperGemma4-26B (Jiunsong) Gemma4 26B 无审查 MLX, 本地代理加速 DeepSeek-V4-Flash-GGUF (antirez) DS4引擎专用量化,128/256GB Mac本地推理 Bonsai-8B-mlx-1bit (PrismML) Apple Silicon 的 1-bit LLM,端侧极低内存推理 Minimalism (salakash) 为开发者输出最少代码行的可运行代码 HRM-Text-1B (sapientinc) 1B预对齐前缀LM,用前缀条件做结构化输出与推理

2026-05-18

SuperGemma4-26B-Uncensored (Jiunsong) 无审查Gemma 4 26B GGUF,适合苹果硅本地快速推理 DeepSeek-V4-Flash (DeepSeek) 13B激活MoE,1M上下文,面向推理与代码

2026-05-16

Nandi-Mini-600M (FrontiersMind) 600M参数早期检查点,面向低资源多语言部署 DeepSeek-V4-Pro (DeepSeek) 1.6T参数MoE模型,1M上下文,含推理模式 Ring-2.6-1T (inclusionAI) 万亿参数推理模型,面向Agent与复杂工作流