小信邀您云赏海棠,用热词描绘出您心目中的燕理!
每日一问:燕理海棠开了吗?
开了吗?开了呀!
草木复苏,生机与活力
早就悄悄爬上了枝头
你看,这海棠漫天将绽
就是春笔下最美的文案
风摇影动,一树海棠翩跹而下
降落在海棠大道上
便托起了春天前行的脚步
4月13日 14:00,燕京理工学院特推出“燕理的海棠花开了”直播活动,于官方视频号、官方微博同步播出,邀您一起“云”赏花,共赴一场春天的约会。
届时,燕京理工学院信息科学与技术学院大数据助力燕理云赏花,让我们在赏海花时一起描绘出你心目中的燕理的样子!
大家可以为自己喜欢的老师打call,并选出自己心中最能代表学校及学院的词;你的选择将出现在大屏幕上,并有机会在直播中展现哟~
打call地址:
http://124.220.37.167:9999/
(可点击图文左下角阅读原文进入)
▲信息科学与技术学院热词内容
在如今这个数字时代,海量的数据以几何级数在“云端”汇聚;这是大数据时代令人兴奋的信息图谱,所谓词云,就是利用语言分析技术,对大数据文本进行词频分析,并生成可视化图像的技术。
词云又叫文字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,词云将词语按照频度递减排列,并以文字的大小代表词语重要性。词云图是一种用来展现高频关键词的可视化表达,通过文字、色彩、图形的搭配,产生有冲击力地视觉效果,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思,从而传达有价值的信息。
词云制作基本步骤应该是:1.根据输入的文本进行选择;2.对文本进行分词处理;3.对已拆分的关键词进行整合处理以及合并同类词处理;4.对于保留的关键词进行词频统计;5.根据统计出的词频制作词云图。
原理主要是对用户输入的内容进行分词,统计各个词出现的次数,然后根据出现的次数,设置显示样式,例如大小、颜色等,从而使用户快速领略文本的主旨,python中提供的jieba中文库可以快速生成词云图。(python是一个当下很流行的编程语言,你不仅可以用它做数据分析和可视化,还能用来做网站、爬取数据)其中jieba库有三种分词模式(精准模式、全模式、搜索引擎模式),可将其与workload库联合使用从而输入的内容生成相应的词云图。生成中文词云分为以下几个步骤:1.读取文件内容、借助jieba库对中文进行分词,然后将结果合并以空格隔开;3.打开图片文件,得到对应数组;4.创建wordcloud对象,设置基本信息;5.生成词云图显示。最后,将云服务器进行相关资源的配置之后,把制作好的脚本代码部署到云服务器上运行,在浏览器中输入域名即可显示。
▲大数据助力燕理云赏花
▲微信&微博直播地址
灼灼盛开的海棠
不知又将搅动何处的梦
于灵魂之上
烙印下春的情书
4月13日 14:00
我们不见不散