标签:jieba txt 读取 python text 云图 词云 文本
使用现有的txt文本和图片,就可以用wordcloud包生成词云图。大致步骤是:
1、读取txt文本并简单处理;
2、读取图片,以用作背景;
3、生成词云对象,保存为文件。
需要用到3个库:jieba(用于分割文本为词语)、imageio(用于读取图片)、wordcloud(功能核心,用于生成词云)。
我用简历和我的照片,生成了一个词云图,如下:
代码如下:
import jieba import imageio import wordcloud # 读取txt文本 with open('resume.txt','r',encoding='utf-8') as f: text = f.read() # 简单处理文本,删除空格等多余字符 text = text.replace(' ','').replace('\t','').replace('\n','') # 使用jieba分隔词语 wordlist = jieba.lcut(text) # ['aa','bb','cc'...] # print(wordlist) # 用空格连接各个词语,又形成一个大字符串 string = ' '.join(wordlist) # 'aa bb cc' # 读取图片 image = imageio.imread('ding.jpg') # 生成词云图片 # 先实例化一个词云对象 wc = wordcloud.WordCloud(width=image.shape[0], # 词云图宽度同原图片宽度 height=image.shape[1], background_color='white', # 背景颜色白色 font_path='msyh.ttc', # 指定字体路径,微软雅黑,可从win自带的字体库中找 mask=image, # mask 指定词云形状图片,默认为矩形 scale=3) # 默认为1,越大越清晰 # 再给词云输入文字 wc.generate(text) # 保存成文件 wc.to_file('wordcloud21.png')
标签:jieba,txt,读取,python,text,云图,词云,文本 来源: https://www.cnblogs.com/djlbolgs/p/12912625.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。