近日,百度千帆团队正式推出全新文档智能模型——千帆OCR(Qianfan-OCR)。该模型参数量达40亿,首次将文档版面分析、文字识别(OCR)、结构理解与语义解析深度融合于统一的视觉-语言架构中,彻底告别传统OCR依赖多阶段串联(如先检测再识别最后后处理)的繁琐流程。
用户只需上传一张文档图像(如PDF截图、扫描件或手机拍照),模型即可端到端输出结构化Markdown文本,精准保留标题、段落、列表、公式及复杂表格等格式。更值得一提的是,它原生支持Prompt驱动任务,例如“提取第三页的采购表格”或“用中文总结这份合同的关键条款”,大幅降低下游应用开发门槛。
作为千帆大模型生态在垂直场景的重要落地,Qianfan-OCR展现了国产AI在文档智能领域的工程化突破,为金融、政务、教育等高文档密度行业提供更轻量、更可控的AI解析新范式。
来源:MarkTechPost
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END


请登录后查看评论内容