Python读取word文件并绘制词云图
要在Python中读取Word文件并绘制词云图,你需要使用python-docx
库来读取Word文件并提取文本,以及wordcloud
库来生成词云图。以下是一个简单的例子:
首先,安装所需的库(如果尚未安装):
pip install python-docx
pip install wordcloud
pip install numpy
pip install matplotlib
然后,使用以下代码:
from docx import Document
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import numpy as np
# 读取Word文件
doc = Document('example.docx')
text = []
for para in doc.paragraphs:
text.append(para.text)
# 将所有文本合并为一个字符串
full_text = ' '.join(text)
# 生成词云图
wordcloud = WordCloud(background_color='white', width=800, height=600, max_words=200, max_font_size=40, random_state=1).generate(full_text)
# 显示词云图
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
确保将example.docx
替换为你的Word文件名。上述代码将Word文件中的文本提取出来,并使用wordcloud
库生成词云图,最后展示出来。
评论已关闭