信院聚焦
信息学院>信院聚焦

小信邀您云赏海棠,用热词描绘出您心目中的燕理!

每日一问:燕理海棠开了吗?

开了吗?开了呀!

草木复苏,生机与活力

早就悄悄爬上了枝头

你看,这海棠漫天将绽

就是春笔下最美的文案

风摇影动,一树海棠翩跹而下

降落在海棠大道上

便托起了春天前行的脚步

4月13  1400,燕京理工学院特推出“燕理的海棠花开了”直播活动,于官方视频号、官方微博同步播出,邀您一起“云”赏花,共赴一场春天的约会。

届时,燕京理工学院信息科学与技术学院大数据助力燕理云赏花,让我们在赏海花时一起描绘出你心目中的燕理的样子!

大家可以为自己喜欢的老师打call,并选出自己心中最能代表学校及学院的词;你的选择将出现在大屏幕上,并有机会在直播中展现哟~

call地址:

http://124.220.37.167:9999/

(可点击图文左下角阅读原文进入)

▲信息科学与技术学院热词内容

在如今这个数字时代,海量的数据以几何级数在“云端”汇聚;这是大数据时代令人兴奋的信息图谱,所谓词云,就是利用语言分析技术,对大数据文本进行词频分析,并生成可视化图像的技术。

词云又叫文字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,词云将词语按照频度递减排列,并以文字的大小代表词语重要性。词云图是一种用来展现高频关键词的可视化表达,通过文字、色彩、图形的搭配,产生有冲击力地视觉效果,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思,从而传达有价值的信息。

词云制作基本步骤应该是:1.根据输入的文本进行选择;2.对文本进行分词处理;3.对已拆分的关键词进行整合处理以及合并同类词处理;4.对于保留的关键词进行词频统计;5.根据统计出的词频制作词云图。

原理主要是对用户输入的内容进行分词,统计各个词出现的次数,然后根据出现的次数,设置显示样式,例如大小、颜色等,从而使用户快速领略文本的主旨,python中提供的jieba中文库可以快速生成词云图。(python是一个当下很流行的编程语言,你不仅可以用它做数据分析和可视化,还能用来做网站、爬取数据)其中jieba库有三种分词模式(精准模式、全模式、搜索引擎模式),可将其与workload库联合使用从而输入的内容生成相应的词云图。生成中文词云分为以下几个步骤:1.读取文件内容、借助jieba库对中文进行分词,然后将结果合并以空格隔开;3.打开图片文件,得到对应数组;4.创建wordcloud对象,设置基本信息;5.生成词云图显示。最后,将云服务器进行相关资源的配置之后,把制作好的脚本代码部署到云服务器上运行,在浏览器中输入域名即可显示。

▲大数据助力燕理云赏花

▲微信&微博直播地址

灼灼盛开的海棠

不知又将搅动何处的梦

于灵魂之上

烙印下春的情书

413  1400

我们不见不散