利用python批量遍历多个Excel表格文件中指定内容并汇总
为了解决这个问题,我们可以使用Python的pandas
库来处理Excel文件,并使用glob
库来遍历文件夹中的所有Excel文件。以下是一个简单的代码示例,它会遍历指定文件夹中的所有Excel文件,搜索指定的内容,并计算出现的次数。
import pandas as pd
import glob
# 要搜索的内容
search_term = '特定内容'
# Excel文件所在的文件夹路径
folder_path = '路径到文件夹/*.xlsx'
# 用于存储每个文件中搜索内容的出现次数
counts = {}
# 遍历文件夹中的所有Excel文件
for file_path in glob.glob(folder_path):
try:
# 读取Excel文件
df = pd.read_excel(file_path)
# 搜索内容,并计算出现的次数
count = df.applymap(lambda x: x == search_term).any().sum()
# 将文件名和次数添加到字典中
counts[file_path] = count
except Exception as e:
print(f"无法处理文件 {file_path}: {e}")
# 打印出搜索内容出现的总次数
print("搜索内容出现的总次数:")
for file_path, count in counts.items():
print(f"{file_path}: {count}")
确保你已经安装了pandas
和glob
库,如果没有安装,可以使用以下命令安装:
pip install pandas xlrd glob
在这个代码中,folder_path
需要被设置为包含你的Excel文件的文件夹的路径。代码会遍历该文件夹中所有的Excel文件(.xlsx
),并对每个文件执行搜索指定内容的操作。最后,它会打印出每个文件中搜索内容出现的次数以及总和。
评论已关闭