前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

欢迎点击右上角关注小编,除了分享技术文章之外还有很多福利,私信学习资料可以领取包括不限于Python实战演练、PDF电子文档、面试集锦、学习资料等。

5月22日,仝卓曾在直播中分享自己当年考学的压力,聊起当年复读时“往届生变应届生”的经历,“我当时考心仪的大学,是一门心思非这个大学不上,我当时有点较劲,考不上就再来一年。但是呢,这个大学只招应届生,我还搞了很多……然后我就成了应届生,哈哈哈。最后还是没考上,完事儿呢……我就上了中戏。”

 

仝卓学籍造假微博道歉,用Python抓取微博的评论看看群众都说什么 Python 第1张

仝卓在直播中分享“往届生变应届生”的经历

 

在教育部发声之后,仝卓道歉了。

5月29日晚上9点38分,仝卓在其个人微博发布了手写道歉信。

仝卓学籍造假微博道歉,用Python抓取微博的评论看看群众都说什么 Python 第2张

那我们就来用Python抓取这条道歉微博的评论看看群众都说什么?这条评论已经超12万条评论了,因为微博评论抓取有限制,不可能全部抓过去,其实要抓也是可以的,就是费时间呗,所以选择抓取其中连续的1万条左右的微博评论。

这条微博原文地址:

https://weibo.com/2502471581/J4d2R0Euf

最后抓取到的评论及计算的情感指数得分如下:

仝卓学籍造假微博道歉,用Python抓取微博的评论看看群众都说什么 Python 第3张

 

我们先看看整体的情感指数是多少?

仝卓学籍造假微博道歉,用Python抓取微博的评论看看群众都说什么 Python 第4张

这1万个网友评论的情感指数为41.4%,整体情感倾向是中性,但也非常接近负向了。40%以下为负向(蓝色),40%~60%为中性(绿色),60%以上为正向(红色)。

 

 

 

然后看看评论群众都说些什么呢?

仝卓学籍造假微博道歉,用Python抓取微博的评论看看群众都说什么 Python 第5张

这张词云图TOP20关键词依次为:加油、道歉、真的、好好、高考、喜欢、希望、粉丝、直播、事情、谨言慎行、公平、承担、评论、这是、这字、知错就改、学籍、错误、明星。

看来大部分网友还是比较正向的评价的,不过也有网友对书写道歉的字进行了评价。

 

我们再来看看评论网友性别构成如何。

仝卓学籍造假微博道歉,用Python抓取微博的评论看看群众都说什么 Python 第6张

通过这张圆环图可以得知评论网友60%为女性,男性占40%。

那不同性别的网友评论的情感指数与评论关键词是否有区别呢?

首先是男性网友情感指数

仝卓学籍造假微博道歉,用Python抓取微博的评论看看群众都说什么 Python 第7张

男性网友评论的情感指数为36%,情感倾向是负向的。

男性网友评论词云图如下:

仝卓学籍造假微博道歉,用Python抓取微博的评论看看群众都说什么 Python 第8张

TOP20关键词依次为:道歉、高考、真的、粉丝、直播、加油、希望、这是、这字、好好、事情、公平、评论、道歉有用、哈哈哈、舞弊、违法、法律、犯罪、原谅。

可以看到男性网友比整体网友多了一些负向的词:道歉有用的话?舞弊、违法、犯罪、还有幸灾乐祸的哈哈哈。

 

 仝卓学籍造假微博道歉,用Python抓取微博的评论看看群众都说什么 Python 第9张

 

 

 

然后是女性网友情感指数

仝卓学籍造假微博道歉,用Python抓取微博的评论看看群众都说什么 Python 第10张

女性网友评论的情感指数为44.9%,情感倾向是中性的,明显高于男性的,可能是女粉丝比较多的缘故吧。

女性网友评论词云图如下:

仝卓学籍造假微博道歉,用Python抓取微博的评论看看群众都说什么 Python 第11张

TOP20关键词依次为:加油、好好、真的、道歉、喜欢、希望、高考、粉丝、直播、谨言慎行、事情、知错就改、承担、公平、努力、孩子、后果、错误、评论、卓儿。

可以看到女性网友正向关键词更多:加油、好好、希望、喜欢、知错就改、谨言慎行等。

 

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄