归档 / 2026-05-21 / NuExtract3 (NuMind)

NuExtract3 (NuMind)

文档结构化提取和Markdown转换的4B视觉语言模型

部署
入选理由
有HF Space和vLLM接口可即用,但缺乏第三方评测,本质为微调改进
对位
对位Qwen3.5-4B、Gemma-4-E4B等小型文档VLM
适合
发票/合同/表格等文档JSON结构化提取 / 图片/扫描PDF转Markdown供RAG使用
不适合
通用图像问答或纯文本生成
规模
4B · 131k
授权
Apache-2.0
框架
vllm / transformers
可信度
内部600样本benchmark结构提取均分0.651,超Gemma-4-E4B-it(0.538)与Qwen3.5-4B(0.417)

评分详情

Q1
今天能接上用吗   5 / 5
Q2
有可信证据吗   1 / 5
Q3
是新东西吗   3 / 5
总分
9

HuggingFace 原始数据 (抓取于 2026-05-21)

作者
numind
任务类型
image-to-text
推理库
transformers
下载
1,720
点赞
45
许可证
Apache-2.0
标签
transformers, safetensors, qwen3_5, image-text-to-text, vision-language, vlm, document-understanding, structured-extraction, information-extraction, ocr, document-to-markdown, markdown, rag, reasoning, multilingual, conversational, image-to-text, base_model:Qwen/Qwen3.5-4B, base_model:finetune:Qwen/Qwen3.5-4B, license:apache-2.0, endpoints_compatible, region:us

探索

源链接 ↗