归档 / 2026-05-21 / NuExtract3 (NuMind)
NuExtract3 (NuMind)
文档结构化提取和Markdown转换的4B视觉语言模型
- 部署
-
- 入选理由
- 有HF Space和vLLM接口可即用,但缺乏第三方评测,本质为微调改进
- 对位
- 对位Qwen3.5-4B、Gemma-4-E4B等小型文档VLM
- 适合
- 发票/合同/表格等文档JSON结构化提取 / 图片/扫描PDF转Markdown供RAG使用
- 不适合
- 通用图像问答或纯文本生成
- 规模
- 4B · 131k
- 授权
- Apache-2.0
- 框架
- vllm / transformers
- 可信度
- 内部600样本benchmark结构提取均分0.651,超Gemma-4-E4B-it(0.538)与Qwen3.5-4B(0.417)
评分详情
- Q1
- 今天能接上用吗 5 / 5
- Q2
- 有可信证据吗 1 / 5
- Q3
- 是新东西吗 3 / 5
- 总分
- 9
HuggingFace 原始数据 (抓取于 2026-05-21)
- 作者
- numind
- 推理库
- transformers
- 下载
- 1,720
- 点赞
- 45
- 许可证
- Apache-2.0
- 标签
- transformers, safetensors, qwen3_5, image-text-to-text, vision-language, vlm, document-understanding, structured-extraction, information-extraction, ocr, document-to-markdown, markdown, rag, reasoning, multilingual, conversational, image-to-text, base_model:Qwen/Qwen3.5-4B, base_model:finetune:Qwen/Qwen3.5-4B, license:apache-2.0, endpoints_compatible, region:us
探索
源链接 ↗