python+paddleocr 进行图像识别、找到文字在屏幕中的位置

作者：System 时间：2024年08月11日分类：所有,python 字数：845

这篇文章距离上次修改已过537天，其中的内容可能已经有所变动。

使用PaddleOCR进行文字识别并定位文字位置，你需要首先安装PaddlePaddle和PaddleOCR库，然后使用PaddleOCR提供的API进行操作。以下是一个简单的例子：




from paddleocr import PaddleOCR, draw_ocr
from PIL import Image
 
# 创建PaddleOCR对象
ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # "ch"表示中文
 
# 读取图片
image_path = "example.jpg"  # 替换为你的图片路径
image = Image.open(image_path).convert('RGB')
 
# 运行OCR识别
boxes = []
txts = []
scores = []
 
# 识别图片中的文字
rec_res = ocr.ocr(image, cls=True)
 
for line in rec_res:
    boxes.append(line[0])
    txts.append(line[1][0][0])
    scores.append(line[1][0][1])
 
# 绘制文本框和文字
image_show = draw_ocr(image, boxes, txts, scores)
 
# 保存结果图片
image_show.save("output.jpg")

确保在运行此代码之前已经正确安装了PaddlePaddle和PaddleOCR库。




pip install paddlepaddle
pip install paddleocr

这段代码会识别图片中的文字，并将文字的位置标注在原图上，然后保存结果图片。记得替换example.jpg为你自己的图片路径。

python+paddleocr 进行图像识别、找到文字在屏幕中的位置

评论已关闭

推荐阅读