AI 情报 · 每日更新
Access · 需代理
共 77 个 (跨 16 天)
2026-06-03
Mellum2-12B-A2.5B-Thinking (JetBrains)
思考型助手,在<think>块中输出推理链后给出最终答案
LFM2.5-8B-A1B (Liquid AI)
8.3B总参/1.5B活跃,面向端侧个人助手的混合架构模型
2026-06-02
NAVA (Baidu)
6.3B 文本生成同步音视频,支持多说话人音色控制
Cosmos3-Super-Text2Image (nvidia)
文本生成高保真图像,面向物理AI与创作
2026-06-01
Qwen3.5-9B (Qwen)
Qwen3.5-9B MoQ量化版,MTP推测解码,适合本地快速生成
2026-05-31
Qwen3.6-35B-A3B-NVFP4 (NVIDIA)
Qwen3.6-35B-A3B FP4量化版,面向vLLM高效推理
Step-3.7-Flash (StepFun)
198B MoE视觉模型GGUF量化,适合128GB统一内存本地推理
2026-05-29
LFM2.5-8B-A1B (LiquidAI)
混合架构边缘语言模型,GGUF 量化,供 llama.cpp 部署
LFM2.5-8B-A1B (LiquidAI)
端侧部署的混合MoE模型,用于工具调用与多语言助理
Bonsai-Image-Binary-4B (Prism ML)
1-bit量化文生图模型,专为Apple Silicon本地运行
Bonsai Image Ternary 4B (Prism ML)
1.21GB三元文生图模型,4步采样,本地GPU运行
Bonsai-Image-4B (Prism ML)
1.21GB 三元文生图扩散模型,苹果芯片本地运行
2026-05-27
MiMo-V2.5 Coder Q2 (Xiaomi)
128GB Mac本地编码与工具调用GGUF
BitCPM-CANN-8B (OpenBMB)
昇腾原生1.58-bit三元LLM,推理内存降6x,保持95.7%性能
2026-05-26
aro-coder-4bit (ARO-Lang)
为ARO语言微调的代码生成器,4bit量化,供ARO DSL开发者使用
FLUX.1-dev (BFL)
文本到图像生成,用于开发者与创作者的视觉内容创建
PiD (NVIDIA)
像素扩散解码器,将潜在表征一步超分至2K/4K图像
Mega-ASR (THU)
面向远场、混响、重叠语音等严重声学退化的鲁棒语音识别
2026-05-25
speaker-diarization-3.1 (pyannote)
多说话人分割模型,从音频中区分谁在何时说话
2026-05-24
Qwopus3.6-27B-v2 (Jackrong)
Claude CoT 逆推微调的推理模型,支持视觉与工具调用
Qwopus3.6-27B-v2-MTP-GGUF (Jackrong)
多Token预测推理模型,面向编码、数学、DevOps开发者
Qwen3.6-27B (OBLITERATUS)
移除拒绝回路,能力保持,本地全栈部署
Lens (Microsoft)
3.8B文本生成图像基础模型,高效训练与高分辨率生成
2026-05-23
Lens-Turbo (Microsoft)
3.8B 高效文生图,4 步蒸馏,为开发者与创作者快速生成
2026-05-22
Meta-Llama-3-8B-Instruct-4bit (mlx-community)
Llama-3-8B 4-bit版,M系列芯片本地推理
Ternary-Bonsai-8B (Prism ML)
三元1.58-bit量化8B模型,苹果芯片本地推理
2026-05-21
Qwopus3.5-9B-Coder-MTP (Jackrong)
9B多令牌预测代码模型,GGUF量化,面向代码推理
Qwen3.5-397B-A17B (Qwen)
本地运行 397B MoE 多模态,GGUF 量化 + MTP 加速
MiniMax-M2.7 (MiniMax)
MiniMax M2.7 GGUF量化版,适合本地部署与实验
Nemotron-3-Nano-Omni-30B-A3B (NVIDIA)
NVIDIA 多模态推理模型 GGUF 量化版,本地推理用
Qwen3.6-35B-A3B (Qwen)
35B MoE仅3B激活的GGUF量化版,适合本地中文开发
gemma-4-26B-A4B-it (Google)
26B总参/4B活跃的MoE指令模型,面向本地推理
Gemma-4-31B-it-GGUF (LM Studio)
Google 31B 指令模型 GGUF 量化版,本地消费级硬件推理
Qwen3.6-27B (Qwen)
27B参数GGUF版,本地AI原型开发
gemma-4-E2B-it-GGUF (LM Studio)
谷歌 Gemma 4 指令模型 GGUF 量化版,本地高效部署
gemma-4-E4B-it (Google)
Gemma4-4B-it 量化版, 本地轻量推理
Granite-4.1-30B (IBM)
IBM Granite 30B GGUF量化, 本地部署与推理
Granite-4.1-3B-GGUF (IBM)
IBM Granite 4.1 3B GGUF量化,本地推理与边缘部署
Granite-4.1-8B-GGUF (IBM)
IBM Granite 4.1 8B的GGUF量化,用于本地推理
NuExtract3 (NuMind)
文档结构化提取和Markdown转换的4B视觉语言模型
Llama-2-7b-chat-mlx (mlx-community)
Apple芯片上本地运行的Llama2 7B对话模型
Nemotron-Labs-Diffusion-14B (NVIDIA)
三模式 LM (AR/扩散/自推测),为 AI 应用开发者提供高效生成
Qwen3.5-9B-MTP-GGUF (unsloth)
Qwen3.5-9B 多模态模型,MTP 投机解码,本地快速运行
2026-05-20
SuperGemma4-26B (Jiunsong)
Gemma4 26B 无审查 MLX, 本地代理加速
LTX-2.3-Workflows (RuneXX)
LTX-2.3模型的ComfyUI工作流集合,用于图像/视频生成。
DeepSeek-V4-Flash-GGUF (antirez)
DS4引擎专用量化,128/256GB Mac本地推理
XEUS (CMU WAVLab)
覆盖4000+语言的语音基础模型,供ASR/翻译微调
Whisper Large v3 MLX (mlx-community)
Apple Silicon 上运行的 Whisper 语音识别模型
Whisper-large-v3-turbo (mlx-community)
Mac端Whisper large-v3-turbo,MLX低延迟转写
Bonsai-8B-mlx-1bit (PrismML)
Apple Silicon 的 1-bit LLM,端侧极低内存推理
Minimalism (salakash)
为开发者输出最少代码行的可运行代码
HRM-Text-1B (sapientinc)
1B预对齐前缀LM,用前缀条件做结构化输出与推理
2026-05-19
Qwen3.6-35B-A3B-GGUF (Unsloth)
支持MTP加速的3B激活参数量化视觉语言模型,面向本地编程代理
2026-05-18
Irodori-TTS-500M-v3 (Aratako)
日语TTS,表情符号控制风格,零样本克隆
Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF (DavidAU)
解禁版Qwen3.6-27B量化模型,为创意写作与代码而生
Gemma-4-E4B-Aggressive (HauhauCS)
无审查的Gemma 4多模态模型,适合内容生成开发者
Gemma4-26B-A4B-Uncensored-Balanced (HauhauCS)
Gemma4 无审查多模态 MoE,面向创意写作与角色扮演
Qwopus3.5-9B-Coder (Jackrong)
面向Agent编码与工具调用的9B视觉推理模型
SuperGemma4-26B-Uncensored (Jiunsong)
无审查Gemma 4 26B GGUF,适合苹果硅本地快速推理
AsymFLUX.2-klein-9B (Stanford)
像素空间文生图模型,基于AsymFlow,适合文字渲染与细节生成
jina-embeddings-v5-omni-small (Jina)
多模态嵌入模型,支持文本/图像/视频/音频
Qwen3.6-27B-MTP-GGUF (Unsloth)
Qwen3.6-27B的MTP量化版,推理速度1.5-2倍提升
Qwen3.6-35B-A3B-GGUF (Unsloth)
Qwen3.6 MoE GGUF 量化版,用于本地代理编程与多模态推理
Qwen3.6-27B-GGUF (unsloth)
Qwen3.6-27B GGUF量化版,面向本地部署与边缘推理
LTX2.3-10Eros-GGUF (vantagewithai)
LTX2.3 微调的图生视频 GGUF 模型,用于 ComfyUI
2026-05-16
Qwen3.6-40B (DavidAU)
多模态无审查推理模型,面向代码与视觉应用
Nandi-Mini-600M (FrontiersMind)
600M参数早期检查点,面向低资源多语言部署
Qwen3.6-35B-A3B-Uncensored-Aggressive (HauhauCS)
35B MoE 多模态去审查版,创意写作与视觉应用
Dramabox (ResembleAI)
通用文本转语音,面向配音与有声内容制作者
Juggernaut-Z-Image (RunDiffusion)
文本到图像扩散模型,面向 AI 应用构建者
scenema-audio (ScenemaAI)
TTS 模型,面向语音合成开发者
Z-Anime (SeeSee21)
动漫风格图像生成,面向二次元AI应用开发者
Sulphur-2-base (SulphurAI)
无审查文本/图像生成视频,基于LTX2.3
Supertonic 3 (Supertone)
31种语言本地TTS,面向AI应用开发者的语音合成
Leanly_AI (jackxinning)
通用问答模型,适合知识型对话与事实查询。
OmniVoice (k2-fsa)
为开发者提供600+语言零样本语音合成
Sulphur-2-Base (vantagewithai)
图像到视频基座模型,GGUF量化版,适合本地推理
Esc
输入关键词,跨模型 / 数据集 / 空间 检索