百度千帆发布40亿参数OCR大模型:一图直出Markdown

近日,百度千帆团队正式推出全新文档智能模型——千帆OCR(Qianfan-OCR)。该模型参数量达40亿,首次将文档版面分析、文字识别(OCR)、结构理解与语义解析深度融合于统一的视觉-语言架构中,彻底告别传统OCR依赖多阶段串联(如先检测再识别最后后处理)的繁琐流程。

用户只需上传一张文档图像(如PDF截图、扫描件或手机拍照),模型即可端到端输出结构化Markdown文本,精准保留标题、段落、列表、公式及复杂表格等格式。更值得一提的是,它原生支持Prompt驱动任务,例如“提取第三页的采购表格”或“用中文总结这份合同的关键条款”,大幅降低下游应用开发门槛。

作为千帆大模型生态在垂直场景的重要落地,Qianfan-OCR展现了国产AI在文档智能领域的工程化突破,为金融、政务、教育等高文档密度行业提供更轻量、更可控的AI解析新范式。

来源:MarkTechPost

© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片快捷回复

    请登录后查看评论内容