接入文档抽取增强【进阶】

本文档介绍如何接入百度飞桨 PaddleOCR-VL 云版本服务,无需本地部署,直接使用云端 API 能力。

一、申请云服务

1.1 访问 AI Studio

打开浏览器访问:https://aistudio.baidu.com/paddleocr

账号要求

需要先注册百度 并申请 AI Studio 账号,支持百度账号直接登录。 百度一贯做法,先填表单申请,笔者测试秒过

1.2 创建应用并获取凭证

  1. 点击「立即使用」或「创建应用」
  2. 填写应用名称(如:PIG AI OCR)
  3. 创建完成后,在应用详情页获取:
    • API Key:访问令牌
    • Base URL:服务地址
AI Studio 应用凭证获取

配置 PIG AI 系统

直接在模型管理里面添加 PPOCR 模型即可:

2.3 功能效果

RAG 在处理过程中如果开启了 PP-OCRv5 功能,则会优先调用服务进行文字处理。

PP-OCRv5 处理流程