开源模型与工具怎么选?按任务、按硬件、按许可证——只讲能验证的事实。

选型指南

16GB 显存/内存能跑什么本地大模型(2026-07) 先按「Q4 估算明显超 16GB 且库内没有更低位形态」筛掉 11 个不现实的选项,再按用途挑几个能直接上手的。更新于 2026-07-20
本地图像生成入门(2026-07) 18 个本地可跑的开源文生图模型,显存数据大多缺失,先看 intro 再看表。更新于 2026-07-13
中文 TTS 开源模型怎么选(2026-07) 13 张支持中文的开源语音合成模型卡,按使用场景挑重点,不用你一张张翻。更新于 2026-07-10

本周入库

2026-07-15 ~ 2026-07-21 · 新收录 25 · 更新 136 个模型

文本生成

语音识别

向量嵌入

智能体

视觉理解

其他

逐日变更记录 →

工具

手动精选收录 · agent / MCP / skills / 框架 / 记忆 · 共 77 个

Orca 并行编排多个 CLI 编码 agent 的桌面应用,各跑在独立 git worktree 中,统一审阅合并 Apple Design 将 Apple WWDC 设计理念提炼为 17 条 AI 可执行的网页设计原则 ECC 跨 harness 的 agent 编码技能与配置系统,含 agents、skills、rules、hooks 等组件 colibrì 纯 C 推理引擎,25 GB 消费机上跑 744B MoE,专家从磁盘流式加载 Archify 给 coding agent 的图表技能:用自然语言描述系统,生成可切换主题、可 4 倍导出的 HTML 架构图 Diffusers Hugging Face 的扩散模型库,几行代码跑图像/视频/音频生成 Transformers 预训练模型的事实标准加载库:集中定义模型架构,训练框架与推理引擎共享同一套模型格式 SGLang LLM 推理引擎:前缀缓存、约束解码与多模态 serving,从单 GPU 到万卡集群 MLX LM Apple 官方的 Apple Silicon LLM 推理与微调工具,带 OpenAI 兼容 HTTP 服务 vLLM GPU 高吞吐 LLM 推理与服务引擎,支持 200+ 模型架构 llama.cpp 纯 C/C++ 的 LLM 推理引擎,CPU 优先、零依赖 Ollama 本地跑开源模型的最简入口,一行命令拉取运行,支持 GGUF 导入与量化 caveman 编码 agent 的输出压缩技能,去冗余留实质,输出 token 降约 65%,支持 30+ agent EverOS 本地优先的 AI agent 记忆层：Markdown 为源，自进化技能记忆 GBrain AI agent 的记忆层：自织知识图谱 + 混合检索 + 合成答案，markdown 为数据源 OpenMontage 把 AI 编程助手变成视频制作工作室,agent 驱动 12 条生产线从研究到成片全自动 GSAP Skills GSAP 官方 AI 技能包,教 coding agent 正确使用 GSAP 动画库 Handy 离线语音转文字桌面应用,快捷键说话即粘贴 PixelRAG 把网页渲染成截图再检索,跳过 HTML 解析直接让视觉模型读页面 Browser Harness 让 LLM 通过 CDP 直连真实 Chrome 的薄层 harness，agent 运行时自行补全缺失的辅助函数 Pioneer Fastino 的托管微调与推理平台:用 prompt 微调小模型,部署后持续从生产数据自动改进 Ponytail 给 AI 编码 agent 植入“懒人 senior dev”思维:优先用标准库与平台原生能力,抑制过度工程 Spec Kit GitHub 出品的规格驱动开发工具包,让 AI agent 按 spec→plan→tasks→implement 四步出码 MemPalace 本地优先的 AI 记忆系统：逐字存储对话，语义检索，MCP 接入 Claude Code 等客户端 Agent Skills 24 个结构化工作流,将软件开发生命周期全流程编码为 AI 编码 agent 可执行的 SKILL.md Scientific Agent Skills K-Dense 出品的科学 agent 技能集,147 个技能覆盖生物信息学、药物发现、临床研究等领域 OpenHands 自托管编码 agent 控制中心：接多种 agent 与 LLM，支持本地、Docker、VM 和云端运行 NotebookLM CLI & MCP Server 通过 CLI 或 MCP 让 AI agent 操控 NotebookLM:建笔记本、加来源、生成播客/幻灯片/信息图 claude-obsidian 给 Claude Code 的一套 Obsidian 知识库技能:自动摄入来源、构建互联维基、跨会话记忆,基于 Karpathy 的 LLM Wiki 模式 Graphify 把代码、文档、论文、图片等建成可查询知识图谱，供 AI 编程助手调用 grill-me / grill-with-docs Matt Pocock 的 agent 盘问 skill:动手前让 AI 逐层追问设计,直到决策树穷尽;grill-with-docs 还会建立项目术语表 codebase-memory-mcp 把代码库索引成知识图谱的 MCP Server,供编码 agent 用图查询替代逐文件搜索 SkillOpt 不改模型权重,把 skill 文档当可训练状态,用 rollout-反思-编辑-验证门控循环自动优化 PPT Master 在 AI IDE 里把文档、PDF 等转成原生可编辑的 PPTX，输出真实 PowerPoint 形状而非静态图片 Stitch Google Labs 的 AI 设计画布,从自然语言生成 UI 界面与前端代码 Cypress 浏览器内运行的前端端到端与组件测试框架 bb-browser 把浏览器登录态变成 AI agent 的 CLI 接口，36 个平台 103 条命令直接用你的真实 Chrome Puppeteer Google 出品的 JS 库，通过 DevTools Protocol / WebDriver BiDi 控制 Chrome 与 Firefox AnySearch Skill 给 AI agent 的实时搜索 skill,统一 API 接 17 个垂直领域 CodeGraph 本地代码知识图谱,预索引符号关系供 AI agent 通过 MCP 直接查询 Remove-AI-Watermarks CLI 与 Python 库,去除 AI 生成图片的可见/不可见水印与来源元数据 Matt Pocock Skills Matt Pocock 的 agent skill 合集,针对 coding agent 常见失效模式:对齐、共享语言、TDD、架构 Remotion 用 React 组件编程式生成 MP4 视频的框架 HyperFrames 用 HTML 写视频,渲染为确定性 MP4;为 AI coding agent 原生设计 Claude Code History Viewer 统一浏览 10 款 AI 编程助手本地对话历史的桌面应用，也提供无头服务器模式 Animal-Island-UI 灵感来自《动物森友会》界面的 React 组件库，视觉元素与动画独立设计 teach 苏格拉底式 agent skill,带学习者档案与间隔复习,多模式教学 Understand Anything 把代码库扫描成交互式知识图谱,供开发者与 AI agent 理解大型项目 Pieces 本地优先的工作流记忆平台,自动捕获上下文并通过 MCP 接入 AI 编码工具 Science Skills Google DeepMind 的科学 agent 技能集,覆盖基因组学、结构生物学、文献检索等领域 Impeccable 给 AI 编码 agent 的设计 skill:23 条命令、41 条检测规则、浏览器实时迭代 Cloud CLI 给 Claude Code、Cursor CLI 等命令行编码 agent 加一层 Web/移动端界面 oMLX Apple Silicon 上的 LLM 推理服务器,两级 KV 缓存 + 菜单栏管理 LobeHub 多 agent 编排平台：构建、调度 agent 团队 7×24 运行，支持自托管 LLM 从命令行与 Python 调用百余种大语言模型的统一接口，带插件体系与工具调用 ForgeCode 终端 AI 编码 harness:Zsh 内 `:` 发指令,三 agent 分工研/策/写,接 300+ 模型 Obscura Rust 无头浏览器，专为 AI agent 与抓取设计，兼容 Puppeteer/Playwright Agent Reach 给 AI agent 一键装上互联网能力：安装器 + 体检 + 多后端路由，零 API 费用 Academic Research Skills Claude Code 学术研究技能套件:文献调研→写作→审稿→发表 NexSandglass 零依赖的 agent 本地记忆系统,追踪决策偏移与人格演进,支持 MCP 接入 Rapid-MLX Apple Silicon 本地推理引擎, OpenAI API 兼容 agentmemory 编码 agent 的持久记忆引擎:单进程本地运行,零外部数据库,原生 MCP 支持 Comet 把 OpenSpec 与 Superpowers 串成五阶段开发管线,脚本守护防漂移,支持 28 平台 Deep Agents LangChain 的 agent harness,内置规划、文件系统与子 agent Aider 终端里的 AI 结对编程,直接编辑 Git 仓库代码并自动提交 DeerFlow 开源 SuperAgent harness，协同沙箱、子 agent、记忆与技能完成长时任务 Superpowers 给 Claude Code 等 coding agent 的工作流纪律包，把计划、TDD、调试等开发流程编成自动触发的技能 Docling 把 PDF、Office、图片、音频等解析成喂给 gen AI 的 Markdown,可全本地跑 Mem0 给 AI agent 的长期记忆层,跨会话记住偏好与事实;开源可自托管,也有托管平台 gstack 角色化开发 slash 技能,从规划串到发布;支持 Claude Code 等 10 种 AI agent MarkItDown 把 PDF、Office、图片等几十种格式转成喂给 LLM 的 Markdown Hermes WebUI 给 Nous Research 的 Hermes Agent 套一个浏览器/手机界面,功能与命令行近乎一致 Pi Agent 极简终端编码 agent:可用 TypeScript 深度扩展的 CLI,接十余家 LLM,原生支持会话分叉与恢复 Langflow 可视化拖拽搭建 AI agent 与工作流的低代码平台,每条流程可导出为 API / MCP server Open Design 本地优先、开源的 Claude Design 替代品:把本机编码 agent 变成设计引擎,出原型 / 幻灯 / 图像 / 视频 Andrej Karpathy Skills 把 Karpathy 归纳的 LLM 编码常见问题,提炼为四条写码准则 LLM Wiki Karpathy 提的范式——让 LLM 把原始资料增量编译成互链知识库,取代每次重新检索的 RAG