🌹 MinerU 资源汇总及博客说明

MienrU各类资源汇总及开设这个博客的初衷

首次揭秘!腾讯多模态OCR大模型最新技术演进:没有最强OCR,只有无限进化!

腾讯优图实验室推出第五代OCR大模型DocLM v5,通过内容感知视觉过滤和文档对象对比学习技术,实现复杂文档95%+识别准确率与5ms/Token的高效处理,已应用于物流、医疗等行业的智能化升级。

Gemini CLI 产品体验

谷歌开源Gemini CLI终端工具,支持直接调用大模型处理任务,但实测显示当前版本存在权限限制和功能完善度不足的问题。分享 选择其他模型回答生成思维导图翻译网页阅读文档全部Monica

MinerU × Cherry Studio:知识库再添动力!

"MinerU与Cherry Studio达成合作,集成文档解析能力,用户可享每日500页免费预处理额度,提升知识库构建与对话交互效率。”

MinerU 技术报告(原文)

这是MinerU的技术报告,介绍了MienrU这个用于高精度文档内容提取的开源解决方案。 MinerU 利用先进的 PDF-Extract-Kit 模型有效地从各种文档中提取内容,并采用精细调整的预处理和后处理规则来确保最终结果的准确性。