业务人员学Python系列(5):十行代码定制属于自己的词云

俗话说:不要只顾低头拉车,还要抬头看路。意思就是在努力的同时,也要经常看看方向,不断明确目标。咱们学习Python也一样,既要认真的学,又要经常看看学了有什么用。这就是咱们这个系列的特点,通过职场中的实际问题,来沉浸式的学习Python。说实话,这也是Python的一大优势,边学边解决问题。她就像一个软件工具,几行代码就能解决一个实际职场中的问题,比如我们第三节介绍的,仅仅用三行代码就解决了一个经常遇到的问题。这和使用一些软件工具,如excel,剪影,美图秀秀没太大的区别。这些工具你也要简单的学习它的基本操作,只不过他们是用图形方式展示的,Python是用程序语句展示的。

1、什么是词云

今天,我们继续介绍怎么用Python解决职场中的实际问题。对了,就是怎么定制自己的词云。什么是词云呢?“词云”由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于2006年最先使用。 “词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。词云”就是数据可视化的一种形式。给出一段文本的关键词,根据关键词的出现频率而生成的一幅图像,人们只要扫一眼就能够明白文章主旨。如下图:

有人说,工作做得好的,不如PPT做得好。这不是让大家投机取巧,而是让大家学会更好的展示自己的工作成果。词云,就是一种可视化手段,在很多场合可以使你的工作成果得到更好的展示,更有冲击力,说服力。比如,对材料的总结分析;比如年终工作总结在PPT上展示一下这一年来的工作内容词云等等。你想要感受一下词云的效果,可以在百度搜素词云图片,真是外采缤纷,创意十足。

今天,我们就用Python制作属于自己的词云,非常简单。别忘了,玩Python就是做一个无所不能的调包侠而已。

2、安装第三方库

要做调包侠,当然需要安装第三方库了。本文介绍的方法,需要安装三个第三方库,他们是:

wordcloud、jieba、matplotlib

  • 第一个库,看名字就知道是生成词云的;
  • 第二个库,对拼音“结巴”,是对中文文章进行词语分割的,即:分词。名字起得很形象吧;
  • 第三个库,是进行可视化展示的,即生成图片什么的。

还记得怎么用Thonny安装第三方库吗?忘了的话复习一下第三节。

一定要把三个库都安装上,再进行下面的实操学习。

3、撸代码,生成定制的词云

先把代码秀出来,通过前面的学习,今天我们可以进行简单的代码分析了。这说明,你不但知其然,而且知其所以然,越来越专业了。

有效代码正好十行,为了清晰,便于讲解,大致分为四个部分。

  • 1-3行:引入我们的第三方库,这里有几种形式,你现在照着输入即可;
  • 6-9行:这个是上一节讲的,你能说明吗?对,三个引号的字符串,也就是你要做词云的文字。这里,我们用的是刘禹锡的《陋室铭》;
  • 11行:用jieba对文字进行分词处理;
  • 12行:这个也是上节讲的字符串操作方法。用空格将分词后的词语连接成一个字符串;
  • 13行:指定词云所用的字体,这里是仿宋体;
  • 14行:生成词云;
  • 16-18行:把生成的词云展示出来。

效果就是下面这样的。

你的结果,可能和我不一样。这是正常的,因为颜色,位置都是随机的。但是文字大小应该是一样的。

今天的这个案例很实用,你可以把文字换成你自己的内容,就可以定制属于自己的词云了。这里,我们仅仅是讲了最基本的词云生成方法,其实正如你百度搜索的那样,词云还可以有各种各样的变化。比如,背景啊,颜色啊,字体啊,轮廓啊等等。这都可以通过完善第13行代码,来实现。希望你能探索一下,举一反三,制作出更漂亮的,有特色的词云来。

相关文章

三步编写一个Python词云制作小工具

步骤1:配置对象参数import wordcloud# pip install wordcloud w=wordcloud.WordCloud()#生成一个词云对象步骤2:加载词云文本txt="...

python爬取B站视频弹幕分析并制作词云

1.分析网页视频地址: www.bilibili.com/video/BV19E… 本身博主同时也是一名up主,虽然已经断更好久了,但是不妨碍我爬取弹幕信息来分析呀。 这次我选取的是自己 唯一的爆款视...

python实现文字转语音(百度智能云)

这个应用是对百度智能云的功能调用,需要网络支持,需要到百度注册相应的账号才能使用,商业用户需要收费,有少量数据是免费的可以测试。pip install baidu-aipfrom aip import...

python冷门操作-13.wordcloud干货

wordcloud是优秀的词云展示第三方库-词云以词语为基本单位,更加直观和艺术地展示文本通过词云,我们可以快速提取大段文本的重要信息.体验一下:#直接输出import jieba from word...