Python中WordCloud库及其应用
Python中WordCloud库及其应用使用方法:步骤1:对象参数配置步骤2:加载词云文本步骤3:输出词云文件使用示例词云通过以词语为基本单位,更加直观和艺术地展示文本。wordcloud是优秀的词云展示的python第三方库。前提是完成wordcloud库的安装:(cmd命令行) pip install wordcloud。然后在程序中加载wordcloud库。使用方法:步骤1:配置对象参数步
·
Python中WordCloud库及其应用
词云通过以词语为基本单位,更加直观和艺术地展示文本。wordcloud是优秀的词云展示的python第三方库。
前提是完成wordcloud库的安装:(cmd命令行) pip install wordcloud。
然后在程序中加载wordcloud库。
使用方法:
步骤1:配置对象参数
步骤2:加载词云文本
步骤3:输出词云文件
步骤1:对象参数配置
w = wordcloud.WordCloud(<参数>)
参数包括:
参数 | 含义 | 示例 |
---|---|---|
width | 指定词云对象生成图片的宽度,默认400像素 | w=wordcloud.WordCloud(width=600) |
height | 指定词云对象生成图片的高度,默认200像素 | w=wordcloud.WordCloud(height=400) |
in_font_size | 指定词云中字体的最小字号,默认4号 | w=wordcloud.WordCloud(min_font_size=10) |
max_font_size | 指定词云中字体的最大字号,根据高度自动调节 | w=wordcloud.WordCloud(max_font_size=20) |
font_step | 指定词云中字体字号的步进间隔,默认为1 | w=wordcloud.WordCloud(font_step=2) |
font_path | 指定字体文件的路径,默认None | w=wordcloud.WordCloud(font_path=“msyh.ttc”) |
max_words | 指定词云显示的最大单词数量,默认200 | w=wordcloud.WordCloud(max_words=20) |
stop_words | 指定词云的排除词列表,即不显示的单词列表 | w=wordcloud.WordCloud(stop_words={“Python”}) |
mask | 指定词云形状,默认为长方形,需要引用imageio()函数 | #import imageio #mk=imageio.imread(“pic.png”) #w=wordcloud.WordCloud(mask=mk) |
background_color | 指定词云图片的背景颜色,默认为黑色 | w=wordcloud.WordCloud(background_color=“white”) |
步骤2:加载词云文本
方法 | 含义 |
---|---|
w.generate(txt) | 向WordCloud对象w中加载文本txt |
步骤3:输出词云文件
方法 | 含义 |
---|---|
w.to_file(filename) | 将词云输出为图像文件,.png或.jpg格式 |
使用示例
此处将python中函数语言相关规范存入到一个Wordcloud_test.txt文件中生成词云
函数和方法
下文所指的函数,包括函数, 方法, 以及生成器.
一个函数必须要有文档字符串, 除非它满足以下条件:
外部不可见
非常短小
简单明了
文档字符串应该包含函数做什么, 以及输入和输出的详细描述. 通常, 不应该描述”怎么做”, 除非是一些复杂的算法. 文档字符串应该提供足够的信息, 当别人编写代码调用该函数时, 他不需要看一行代码, 只要看文档字符串就可以了. 对于复杂的代码, 在代码旁边加注释会比使用文档字符串更有意义. 覆盖基类的子类方法应有一个类似 See base class 的简单注释来指引读者到基类方法的文档注释.若重载的子类方法和基类方法有很大不同,那么注释中应该指明这些信息.
关于函数的几个方面应该在特定的小节中进行描述记录, 这几个方面如下文所述. 每节应该以一个标题行开始. 标题行以冒号结尾. 除标题行外, 节的其他内容应被缩进2个空格.
Args:
列出每个参数的名字, 并在名字后使用一个冒号和一个空格, 分隔对该参数的描述.如果描述太长超过了单行80字符,使用2或者4个空格的悬挂缩进(与文件其他部分保持一致). 描述应该包括所需的类型和含义. 如果一个函数接受*foo(可变长度参数列表)或者**bar (任意关键字参数), 应该详细列出*foo和**bar.
Returns: (或者 Yields: 用于生成器)
描述返回值的类型和语义. 如果函数返回None, 这一部分可以省略.
Raises:
列出与接口有关的所有异常.
背景图用中国地图。
具体代码:
import jieba
import wordcloud
import imageio
mask = imageio.imread("bckg.jpg")
excludes = {}
#导入txt文件
f = open("Wordcloud_test.txt", "r", encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(\
width = 1000, height = 700,\
background_color = "white",
font_path = "msyh.ttc", mask = mask
)
w.generate(txt)
w.to_file("tswordcloudm.png")
结果如图
当然这个结果看来没啥指导意义。只供学习。
参考自中国大学MOOC。
更多推荐
已为社区贡献1条内容
所有评论(0)