python-自动化篇-办公-一键将word中的表格提取到excel文件中
要将Word文档中的表格提取到Excel文件中,可以使用python-docx
库来读取Word文档,使用pandas
库来处理表格数据,并使用openpyxl
库来创建和写入Excel文件。以下是一个简单的示例代码:
import docx
import pandas as pd
from openpyxl import Workbook
# 读取Word文档
doc = docx.Document('example.docx')
# 提取Word中的表格到pandas DataFrame列表
tables = [table.rows for table in doc.tables]
data_frames = [pd.DataFrame(t) for t in tables]
# 创建一个Excel工作簿
wb = Workbook()
# 将每个DataFrame写入到不同的工作表中
for df, sheet_name in zip(data_frames, ['Sheet1', 'Sheet2', 'Sheet3']):
df.to_excel(wb, sheet_name=sheet_name, index=False, header=False)
# 保存工作簿
wb.save('tables.xlsx')
确保在运行代码之前已经安装了所需的库:
pip install python-docx pandas openpyxl
这段代码假设Word文档中只有表格,并且每个表格将被提取到一个Excel工作表中。如果Word文档中包含多个表格,它们将被按顺序分配到Excel文件的不同工作表中。如果表格数据需要有列名,可以在df.to_excel
调用中添加相应的列名。
评论已关闭