如何用Python代码绘制评论内容的词云图
要用Python代码绘制评论内容的词云图,首先需要安装相应的库。常用的词云库有wordcloud和jieba。
安装wordcloud库:
pip install wordcloud
安装jieba库:
pip install jieba
接下来,我们可以使用以下代码来绘制评论内容的词云图:
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取评论内容
comments = open('comments.txt', 'r', encoding='utf-8').read()
# 使用jieba分词进行中文分词
wordlist = jieba.cut(comments, cut_all=True)
# 连接词语
word_space_split = ' '.join(wordlist)
# 设置词云图参数
wc = WordCloud(font_path='simsun.ttf', # 设置字体,这里使用的是微软雅黑字体
background_color='white', # 设置背景颜色
max_words=2000, # 设置最大显示的词数
max_font_size=100, # 设置字体最大值
width=800, # 设置画布的宽度
height=600 # 设置画布的高度
)
# 生成词云图
wordcloud = wc.generate(word_space_split)
# 显示词云图
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
以上代码首先读取评论内容,然后使用jieba库进行中文分词,将分词结果用空格连接起来。接着,使用WordCloud类创建一个词云图对象,并设置相关参数,如字体、背景颜色、最大显示词数等。最后,调用generate()方法生成词云图,并使用matplotlib库显示词云图。
请将代码中的comments.txt替换为你的评论内容文件的路径,simsun.ttf替换为你希望使用的字体文件的路径。如果不指定字体文件,默认字体可能无法显示中文
原文地址: http://www.cveoy.top/t/topic/iNrg 著作权归作者所有。请勿转载和采集!