ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

python 中关于词云wordcloud的一些总结:

2021-05-27 15:35:23  阅读:240  来源: 互联网

标签:None 字体大小 python 默认 单词 wordcloud 词云 整型 wc


 

wordcloud类

from wordcloud import WordCloud

wc = WordCloud(参数)

#参数
# font_path:字体文件(OTF或TTF)的路径,字符串

# width:绘图区宽度,默认400,整型

# height:绘图区高度,默认200,整型

# prefer_horizontal:单词倾向于水平放置还是垂直放置,如果值小于1,则会在不合适的情况下旋转单词,浮点型,默认0.9

# mask:是否在给定的形状内绘制单词,这个参数使我们能够根据给定的轮廓形状绘制各种词云图,当此参数不为None时,width和height将被忽略,nd-array型或None,默认None

# scale:计算过程和实际绘图的比例,浮点型,默认1

# min_font_size:绘图时最小的字体大小,整型,默认4

# font_step:字体大小的迭代步长,大于1时可能会出现错误排列,整型,默认1

# max_words:绘图使用的最大单词数,整型,默认200

# stopwords:排除的单词集,字符串集或None,默认为None时,内置的字符串集将会被使用

# background_color:背景颜色,颜色值,默认为'black'

# max_font_size:绘图时最大字体大小,整型或None,默认为None

# mode:模式,默认为'RGB',当为'RGBA'时,倘若背景颜色为None,则会得到透明的背景

# relative_scaling:单词出现频率对其字体大小的权重,值为0时,只考虑单词排名对字体大小的影响,值为1时,具有2倍出现频率的单词具有2倍的字体大小,一般值设置为0.5最棒,浮点型

# color_func:颜色函数,用于生成不同颜色单词的词云图,默认为None

# regexp:正则表达式,用于分词,默认为 r"\w[\w']+" 

# collocations:是否包括二元词组,布尔型,默认为True

# colormap:颜色图,随机分配颜色给每个单词,如果指定了color_func,则本参数被忽略,字符串或matplotlib colormap型,默认为'viridis'

# normalize_plurals:移除单词末尾的's',布尔型,默认为True

属性

wc.words_
#对应频率的词例,字典类型{字符串:浮点数}

wc.layout_
#记录每个单词的值,字体大小,位置,方向以及颜色,由一系列元组组成的列表,每个元组格式为(string, int, (int, int), int, color)

方法

wc.generate(text)
#从文本中生成词云图

wc.fit_words(frequencies)
#根据给定单词及频率生成词云图
#frequencies:元组型数组,每个元组包含一个单词及其频率

wc.generate_from_frequencies(frequencies, max_font_size=None)
#根据给定单词及频率生成词云图
#frequencies:字典,包含字符串(单词):浮点数(频率)的值对
#max_font_size:最大字体大小

wc.process_text(text)
#将长文本分词,并移除stopwords集合中的单词
#返回字典,dict (string, int)

wc.recolor(random_state=None, color_func=None, colormap=None)
#重新上色
#random_state:随机种子,整型或None

wc.to_array()
#以numpy矩阵的格式返回词云图

to_file(filename)
#以图片的格式返回词云图
#filename:保存路径

  

 

标签:None,字体大小,python,默认,单词,wordcloud,词云,整型,wc
来源: https://www.cnblogs.com/chengxiaoxiao/p/14818051.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有