import cv2
import numpy as np
import pytesseract
from PIL import Image
def preprocess_image(image_path):
# 读取图片并转为灰度图
image = cv2.imread(image_path)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# 使用自适应阈值进行二值化
thresh = cv2.adaptiveThreshold(
gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV, 11, 2)
return thresh
def extract_license_plate(image_path):
# 预处理图片
thresh = preprocess_image(image_path)
# 寻找轮廓
contours, hierarchy = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
# 根据轮廓大小进行排序,找到最大的轮廓
contours = sorted(contours, key=cv2.contourArea, reverse=True)[:5]
# 遍历轮廓并提取车牌区域
for contour in contours:
# 计算轮廓的边界框
x, y, w, h = cv2.boundingRect(contour)
# 通过比例筛选可能的车牌区域
if (float(h) / w > 2.5 and w > h):
# 裁剪车牌区域
license_plate = thresh[y:y + h, x:x + w]
# 保存车牌图片
cv2.imwrite('license_plate.jpg', license_plate)
# 返回处理好的车牌图片路径
return 'license_plate.jpg'
return None
def recognize_license_plate(license_plate_image_path):
# 加载中文字典
pytesseract.set_dictionary_path('chi_sim.traineddata')
# 指定使用中文识别
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
pytesseract.image_to_string(Image.open(license_plate_image_path), lang='chi_sim')
# 示例使用
image_path = 'car_image.jpg'
license_plate_image_path = extract_license_plate(image_path)
if license_plate_image_path:
print(recognize_license_plate(license_plate_image_path))
else:
print("未找到车牌区域")
这个代码示例展示了如何实现一个简单的车牌识别系统。它包括了图像预处理、轮廓查找、车牌区域定位,以及使用Tesseract OCR进行车牌字符识别的主要步骤。这个流程是车牌识别系统的基本框架,对于学习图像处理和文字识别技术有很好的指导价值。