百度千帆发布40亿参数OCR大模型：一图直出Markdown-象者信息AI集锦

近日，百度千帆团队正式推出全新文档智能模型——千帆OCR（Qianfan-OCR）。该模型参数量达40亿，首次将文档版面分析、文字识别（OCR）、结构理解与语义解析深度融合于统一的视觉-语言架构中，彻底告别传统OCR依赖多阶段串联（如先检测再识别最后后处理）的繁琐流程。

用户只需上传一张文档图像（如PDF截图、扫描件或手机拍照），模型即可端到端输出结构化Markdown文本，精准保留标题、段落、列表、公式及复杂表格等格式。更值得一提的是，它原生支持Prompt驱动任务，例如“提取第三页的采购表格”或“用中文总结这份合同的关键条款”，大幅降低下游应用开发门槛。

作为千帆大模型生态在垂直场景的重要落地，Qianfan-OCR展现了国产AI在文档智能领域的工程化突破，为金融、政务、教育等高文档密度行业提供更轻量、更可控的AI解析新范式。

文章版权归作者所有，未经允许请勿转载。

THE END