Access · 需代理

共 77 个 (跨 16 天)

2026-06-03

Mellum2-12B-A2.5B-Thinking (JetBrains) 思考型助手，在<think>块中输出推理链后给出最终答案 LFM2.5-8B-A1B (Liquid AI) 8.3B总参/1.5B活跃，面向端侧个人助手的混合架构模型

2026-06-02

NAVA (Baidu) 6.3B 文本生成同步音视频，支持多说话人音色控制 Cosmos3-Super-Text2Image (nvidia) 文本生成高保真图像，面向物理AI与创作

2026-06-01

Qwen3.5-9B (Qwen) Qwen3.5-9B MoQ量化版，MTP推测解码，适合本地快速生成

2026-05-31

Qwen3.6-35B-A3B-NVFP4 (NVIDIA) Qwen3.6-35B-A3B FP4量化版，面向vLLM高效推理 Step-3.7-Flash (StepFun) 198B MoE视觉模型GGUF量化，适合128GB统一内存本地推理

2026-05-29

LFM2.5-8B-A1B (LiquidAI) 混合架构边缘语言模型，GGUF 量化，供 llama.cpp 部署 LFM2.5-8B-A1B (LiquidAI) 端侧部署的混合MoE模型，用于工具调用与多语言助理 Bonsai-Image-Binary-4B (Prism ML) 1-bit量化文生图模型，专为Apple Silicon本地运行 Bonsai Image Ternary 4B (Prism ML) 1.21GB三元文生图模型，4步采样，本地GPU运行 Bonsai-Image-4B (Prism ML) 1.21GB 三元文生图扩散模型，苹果芯片本地运行

2026-05-27

MiMo-V2.5 Coder Q2 (Xiaomi) 128GB Mac本地编码与工具调用GGUF BitCPM-CANN-8B (OpenBMB) 昇腾原生1.58-bit三元LLM，推理内存降6x，保持95.7%性能

2026-05-26

aro-coder-4bit (ARO-Lang) 为ARO语言微调的代码生成器，4bit量化，供ARO DSL开发者使用 FLUX.1-dev (BFL) 文本到图像生成，用于开发者与创作者的视觉内容创建 PiD (NVIDIA) 像素扩散解码器，将潜在表征一步超分至2K/4K图像 Mega-ASR (THU) 面向远场、混响、重叠语音等严重声学退化的鲁棒语音识别

2026-05-25

speaker-diarization-3.1 (pyannote) 多说话人分割模型，从音频中区分谁在何时说话

2026-05-24

Qwopus3.6-27B-v2 (Jackrong) Claude CoT 逆推微调的推理模型，支持视觉与工具调用 Qwopus3.6-27B-v2-MTP-GGUF (Jackrong) 多Token预测推理模型，面向编码、数学、DevOps开发者 Qwen3.6-27B (OBLITERATUS) 移除拒绝回路，能力保持，本地全栈部署 Lens (Microsoft) 3.8B文本生成图像基础模型，高效训练与高分辨率生成

2026-05-23

Lens-Turbo (Microsoft) 3.8B 高效文生图，4 步蒸馏，为开发者与创作者快速生成

2026-05-22

Meta-Llama-3-8B-Instruct-4bit (mlx-community) Llama-3-8B 4-bit版，M系列芯片本地推理 Ternary-Bonsai-8B (Prism ML) 三元1.58-bit量化8B模型，苹果芯片本地推理

2026-05-21

Qwopus3.5-9B-Coder-MTP (Jackrong) 9B多令牌预测代码模型，GGUF量化，面向代码推理 Qwen3.5-397B-A17B (Qwen) 本地运行 397B MoE 多模态，GGUF 量化 + MTP 加速 MiniMax-M2.7 (MiniMax) MiniMax M2.7 GGUF量化版，适合本地部署与实验 Nemotron-3-Nano-Omni-30B-A3B (NVIDIA) NVIDIA 多模态推理模型 GGUF 量化版，本地推理用 Qwen3.6-35B-A3B (Qwen) 35B MoE仅3B激活的GGUF量化版，适合本地中文开发 gemma-4-26B-A4B-it (Google) 26B总参/4B活跃的MoE指令模型，面向本地推理 Gemma-4-31B-it-GGUF (LM Studio) Google 31B 指令模型 GGUF 量化版，本地消费级硬件推理 Qwen3.6-27B (Qwen) 27B参数GGUF版，本地AI原型开发 gemma-4-E2B-it-GGUF (LM Studio) 谷歌 Gemma 4 指令模型 GGUF 量化版，本地高效部署 gemma-4-E4B-it (Google) Gemma4-4B-it 量化版, 本地轻量推理 Granite-4.1-30B (IBM) IBM Granite 30B GGUF量化, 本地部署与推理 Granite-4.1-3B-GGUF (IBM) IBM Granite 4.1 3B GGUF量化，本地推理与边缘部署 Granite-4.1-8B-GGUF (IBM) IBM Granite 4.1 8B的GGUF量化，用于本地推理 NuExtract3 (NuMind) 文档结构化提取和Markdown转换的4B视觉语言模型 Llama-2-7b-chat-mlx (mlx-community) Apple芯片上本地运行的Llama2 7B对话模型 Nemotron-Labs-Diffusion-14B (NVIDIA) 三模式 LM (AR/扩散/自推测)，为 AI 应用开发者提供高效生成 Qwen3.5-9B-MTP-GGUF (unsloth) Qwen3.5-9B 多模态模型，MTP 投机解码，本地快速运行

2026-05-20

SuperGemma4-26B (Jiunsong) Gemma4 26B 无审查 MLX, 本地代理加速 LTX-2.3-Workflows (RuneXX) LTX-2.3模型的ComfyUI工作流集合，用于图像/视频生成。 DeepSeek-V4-Flash-GGUF (antirez) DS4引擎专用量化，128/256GB Mac本地推理 XEUS (CMU WAVLab) 覆盖4000+语言的语音基础模型，供ASR/翻译微调 Whisper Large v3 MLX (mlx-community) Apple Silicon 上运行的 Whisper 语音识别模型 Whisper-large-v3-turbo (mlx-community) Mac端Whisper large-v3-turbo，MLX低延迟转写 Bonsai-8B-mlx-1bit (PrismML) Apple Silicon 的 1-bit LLM，端侧极低内存推理 Minimalism (salakash) 为开发者输出最少代码行的可运行代码 HRM-Text-1B (sapientinc) 1B预对齐前缀LM，用前缀条件做结构化输出与推理

2026-05-19

Qwen3.6-35B-A3B-GGUF (Unsloth) 支持MTP加速的3B激活参数量化视觉语言模型，面向本地编程代理

2026-05-18

Irodori-TTS-500M-v3 (Aratako) 日语TTS，表情符号控制风格，零样本克隆 Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF (DavidAU) 解禁版Qwen3.6-27B量化模型，为创意写作与代码而生 Gemma-4-E4B-Aggressive (HauhauCS) 无审查的Gemma 4多模态模型，适合内容生成开发者 Gemma4-26B-A4B-Uncensored-Balanced (HauhauCS) Gemma4 无审查多模态 MoE，面向创意写作与角色扮演 Qwopus3.5-9B-Coder (Jackrong) 面向Agent编码与工具调用的9B视觉推理模型 SuperGemma4-26B-Uncensored (Jiunsong) 无审查Gemma 4 26B GGUF，适合苹果硅本地快速推理 AsymFLUX.2-klein-9B (Stanford) 像素空间文生图模型，基于AsymFlow，适合文字渲染与细节生成 jina-embeddings-v5-omni-small (Jina) 多模态嵌入模型，支持文本/图像/视频/音频 Qwen3.6-27B-MTP-GGUF (Unsloth) Qwen3.6-27B的MTP量化版，推理速度1.5-2倍提升 Qwen3.6-35B-A3B-GGUF (Unsloth) Qwen3.6 MoE GGUF 量化版，用于本地代理编程与多模态推理 Qwen3.6-27B-GGUF (unsloth) Qwen3.6-27B GGUF量化版，面向本地部署与边缘推理 LTX2.3-10Eros-GGUF (vantagewithai) LTX2.3 微调的图生视频 GGUF 模型，用于 ComfyUI

2026-05-16

Qwen3.6-40B (DavidAU) 多模态无审查推理模型，面向代码与视觉应用 Nandi-Mini-600M (FrontiersMind) 600M参数早期检查点，面向低资源多语言部署 Qwen3.6-35B-A3B-Uncensored-Aggressive (HauhauCS) 35B MoE 多模态去审查版，创意写作与视觉应用 Dramabox (ResembleAI) 通用文本转语音，面向配音与有声内容制作者 Juggernaut-Z-Image (RunDiffusion) 文本到图像扩散模型，面向 AI 应用构建者 scenema-audio (ScenemaAI) TTS 模型，面向语音合成开发者 Z-Anime (SeeSee21) 动漫风格图像生成，面向二次元AI应用开发者 Sulphur-2-base (SulphurAI) 无审查文本/图像生成视频，基于LTX2.3 Supertonic 3 (Supertone) 31种语言本地TTS，面向AI应用开发者的语音合成 Leanly_AI (jackxinning) 通用问答模型，适合知识型对话与事实查询。 OmniVoice (k2-fsa) 为开发者提供600+语言零样本语音合成 Sulphur-2-Base (vantagewithai) 图像到视频基座模型，GGUF量化版，适合本地推理