python+paddleocr 进行图像识别、找到文字在屏幕中的位置
使用PaddleOCR进行文字识别并定位文字位置,你需要首先安装PaddlePaddle和PaddleOCR库,然后使用PaddleOCR提供的API进行操作。以下是一个简单的例子:
from paddleocr import PaddleOCR, draw_ocr
from PIL import Image
# 创建PaddleOCR对象
ocr = PaddleOCR(use_angle_cls=True, lang="ch") # "ch"表示中文
# 读取图片
image_path = "example.jpg" # 替换为你的图片路径
image = Image.open(image_path).convert('RGB')
# 运行OCR识别
boxes = []
txts = []
scores = []
# 识别图片中的文字
rec_res = ocr.ocr(image, cls=True)
for line in rec_res:
boxes.append(line[0])
txts.append(line[1][0][0])
scores.append(line[1][0][1])
# 绘制文本框和文字
image_show = draw_ocr(image, boxes, txts, scores)
# 保存结果图片
image_show.save("output.jpg")
确保在运行此代码之前已经正确安装了PaddlePaddle和PaddleOCR库。
pip install paddlepaddle
pip install paddleocr
这段代码会识别图片中的文字,并将文字的位置标注在原图上,然后保存结果图片。记得替换example.jpg
为你自己的图片路径。
评论已关闭