python图片转Excel-python文字识别-图片文字识别-亲测可用
import pandas as pd
from PIL import Image
import pytesseract
# 图片转Excel的函数
def img_to_excel(image_path, output_path):
# 使用Tesseract进行图片文字识别
text = pytesseract.image_to_string(Image.open(image_path), lang='eng')
# 将识别的文本保存到Excel文件
df = pd.DataFrame([text.split('\n')])
df.to_excel(output_path, index=False)
# 使用示例
img_to_excel('example.png', 'output.xlsx')
确保在使用前已经安装了pandas
,PIL
和pytesseract
库。pytesseract
是一个OCR库,需要安装Tesseract-OCR并在环境变量中配置其路径。
安装命令:
pip install pandas Pillow pytesseract
确保Tesseract-OCR安装并配置环境变量,可以参考其官方文档进行安装和配置。
评论已关闭