Ubuntu PaddleOCR的API接口使用

要使用Ubuntu上的PaddleOCR API接口，您需要首先安装PaddleOCR库并正确配置环境

安装PaddleOCR：

在终端中运行以下命令以安装PaddleOCR：

pip install paddlepaddle paddlepaddleocr

准备数据集：

为了训练OCR模型，您需要一个带标签的数据集。数据集应包含图像和相应的文本文件。例如，对于英语数据集，您可以使用EMNIST数据集。将数据集放在PaddleOCR/data文件夹中。

训练模型：

在终端中运行以下命令以训练OCR模型：

python PaddleOCR/train.py \
    -c PaddleOCR/configs/rec/ch_ppocr_server_v2.0_rec_infer.yml \
    --train_dataset=PaddleOCR/data/ch_simfang \
    --val_dataset=PaddleOCR/data/ch_simfang \
    --train_batch_size=8 \
    --rec_learning_rate=0.001 \
    --save_dir=PaddleOCR/output

导出训练好的模型：

训练完成后，您可以导出训练好的模型。运行以下命令以导出模型：

python PaddleOCR/export.py \
    -c PaddleOCR/configs/rec/ch_ppocr_server_v2.0_rec_infer.yml \
    --model_dir=PaddleOCR/output/rec \
    --save_dir=PaddleOCR/output/export

使用API接口：

现在，您可以使用导出的模型通过REST API识别图像中的文本。首先，安装Flask库：

pip install flask

接下来，创建一个名为app.py的文件，并添加以下内容：

from flask import Flask, request, jsonify
import paddlepaddle
import paddlepaddleocr

app = Flask(__name__)

def ocr_client(image_path):
    config = paddlepaddleocr.deploy.Config(det_model_dir="PaddleOCR/output/export", rec_model_dir="PaddleOCR/output/export")
    det_loader = paddlepaddleocr.deploy.load_inference_model(config, det_model_type="CRNN")
    rec_loader = paddlepaddleocr.deploy.load_inference_model(config, rec_model_type="CRNN")

    img = paddlepaddle.io.read_image(image_path)
    result = det_loader(img)
    text = "".join([item["text"] for item in result])

    return text

@app.route("/api/recognize", methods=["POST"])
def recognize():
    image_file = request.files["image"]
    image_path = "/tmp/" + image_file.filename
    image_file.save(image_path)

    text = ocr_client(image_path)
    os.remove(image_path)

    return jsonify({"text": text})

if __name__ == "__main__":
    app.run(host="0.0.0.0", port=8080)

现在，运行app.py文件以启动OCR API服务器：

python app.py

要使用API接口，您可以使用curl命令或Postman等工具向http://0.0.0.0:8080/api/recognize发送POST请求，其中包含图像文件的base64编码。例如，使用curl命令：

curl -X POST -H "Content-Type: application/json" -d '{"image": "data:image/jpeg;base64,..."}' http://0.0.0.0:8080/api/recognize

这将返回图像中的文本。

最新问答

相关标签