阅读背景:

数据挖掘之wordcloud词云

来源:互联网 
#-*- coding:utf-8 -*-

"""
优化词云
显示指定图片
"""

import jieba
import matplotlib.pyplot as plt
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
from scipy.misc import imread  #引入读取图片的库
import sys

#读取文件
text = open('d:\content paper\gr.csv').read()
print type(text)

#jieba分词
wordlist = jieba.cut(text,cut_all = True)
wl_space_split = ' '.join(wordlist)

#读取图片
bg_pic = imread('d:\content paper\pic.jpg')


#对分词后的词语绘制词云
my_wordcloud = WordCloud(font_path='c:\windows\Fonts\msyh.ttf',  #字体
                background_color = 'white',             #设置图片背景为白色
                mask = bg_pic,     #指定输出图片形状
                scale=1,      #默认值为1,理解为生成图片的像素密度
                stopwords = STOPWORDS,         # 设置停用词
                ).generate(wl_space_split)


image_color = ImageColorGenerator(bg_pic)              # 提取图片的色彩分布。

#可视化
plt.imshow(my_wordcloud)
plt.imshow(my_wordcloud.recolor(color_func=image_color))  # 输出时,将云图按照图片的色彩分布进行显示。
plt.axis('off')#是否显示x,y下标
plt.show()#-*- coding:utf-8 -*-

"""
优化词云
显示指定图片
"""

imp



你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: