AI 情报 · 每日更新
任务类型 ·
text-generation
共 28 个 (跨 13 天)
2026-06-03
Mellum2-12B-A2.5B-Thinking (JetBrains)
思考型助手,在<think>块中输出推理链后给出最终答案
LFM2.5-8B-A1B (Liquid AI)
8.3B总参/1.5B活跃,面向端侧个人助手的混合架构模型
2026-06-01
Qwen3.5-9B (Qwen)
Qwen3.5-9B MoQ量化版,MTP推测解码,适合本地快速生成
2026-05-31
Qwen3.6-35B-A3B-NVFP4 (NVIDIA)
Qwen3.6-35B-A3B FP4量化版,面向vLLM高效推理
2026-05-29
LFM2.5-8B-A1B (LiquidAI)
混合架构边缘语言模型,GGUF 量化,供 llama.cpp 部署
LFM2.5-8B-A1B (LiquidAI)
端侧部署的混合MoE模型,用于工具调用与多语言助理
2026-05-28
MiniCPM5-1B-GGUF (OpenBMB)
1B 模型 GGUF 量化,本地 agent 与边缘部署用
2026-05-27
MiMo-V2.5 Coder Q2 (Xiaomi)
128GB Mac本地编码与工具调用GGUF
BitCPM-CANN-8B (OpenBMB)
昇腾原生1.58-bit三元LLM,推理内存降6x,保持95.7%性能
2026-05-26
aro-coder-4bit (ARO-Lang)
为ARO语言微调的代码生成器,4bit量化,供ARO DSL开发者使用
MiniCPM5-1B (OpenBMB)
1B 端侧模型,工具调用与混合推理
2026-05-24
Qwopus3.6-27B-v2-MTP-GGUF (Jackrong)
多Token预测推理模型,面向编码、数学、DevOps开发者
Qwen3.6-27B (OBLITERATUS)
移除拒绝回路,能力保持,本地全栈部署
2026-05-22
Meta-Llama-3-8B-Instruct-4bit (mlx-community)
Llama-3-8B 4-bit版,M系列芯片本地推理
Ternary-Bonsai-8B (Prism ML)
三元1.58-bit量化8B模型,苹果芯片本地推理
2026-05-21
Qwopus3.5-9B-Coder-MTP (Jackrong)
9B多令牌预测代码模型,GGUF量化,面向代码推理
Llama-2-7b-chat-mlx (mlx-community)
Apple芯片上本地运行的Llama2 7B对话模型
Nemotron-Labs-Diffusion-14B (NVIDIA)
三模式 LM (AR/扩散/自推测),为 AI 应用开发者提供高效生成
2026-05-20
SuperGemma4-26B (Jiunsong)
Gemma4 26B 无审查 MLX, 本地代理加速
DeepSeek-V4-Flash-GGUF (antirez)
DS4引擎专用量化,128/256GB Mac本地推理
Bonsai-8B-mlx-1bit (PrismML)
Apple Silicon 的 1-bit LLM,端侧极低内存推理
Minimalism (salakash)
为开发者输出最少代码行的可运行代码
HRM-Text-1B (sapientinc)
1B预对齐前缀LM,用前缀条件做结构化输出与推理
2026-05-18
SuperGemma4-26B-Uncensored (Jiunsong)
无审查Gemma 4 26B GGUF,适合苹果硅本地快速推理
DeepSeek-V4-Flash (DeepSeek)
13B激活MoE,1M上下文,面向推理与代码
2026-05-16
Nandi-Mini-600M (FrontiersMind)
600M参数早期检查点,面向低资源多语言部署
DeepSeek-V4-Pro (DeepSeek)
1.6T参数MoE模型,1M上下文,含推理模式
Ring-2.6-1T (inclusionAI)
万亿参数推理模型,面向Agent与复杂工作流
Esc
输入关键词,跨模型 / 数据集 / 空间 检索