方韩大战的舆情自动分析:小方的评价比韩少差太多了

非常初步的有限范围试验表明,方韩大战(其实也没有真大战过, 基本是小方的单方面攻击 ,从代笔到身高,无所不用其极,加上双方粉丝的大打出手)的舆情自动分析结果是:小方的评价比韩少差太多了。这次试验的数据来源主要是 Twitter,天涯论坛、百度贴吧等,时间跨度大约半年,今年四月到九月。整个过程全自动,没有参杂任何人工干预,比较的结论对于进入视野的数据应该是客观的。因为即便系统有缺陷,那对于所比双方及其数据也是一视同仁(黑)的。

国内最火的新浪微博、腾讯微信等暂时 out of reach,很遗憾。

小方评价比韩寒低太多了
作者: 立委
日期: 09/06/2012 21:21:27
所谓 net sentiment 大体上就是正面评价减去负面 评价的一个指标,小方是大负数,零下41度,小韩略大于零,毁誉参半。哈哈

再看各位的褒贬评价语的分布。

MD, 要是新浪微薄能算进来就好了


Download

方寒大战高频情绪性词的词频分析
日期: 09/20/2012 17:48:03
骂小方的前15高频情绪性用词的词频分析发现“不正常”高居首位:

(方)不正常 (16.9%)
不喜欢 (方) (14.3%)
反对(方) (13.0%)
(方)更烂 (9.1%)
(方)讨厌 (7.8%)
难 (6.5%)
不支持(方) (5.2%)
(方)果然够下贱 (3.9%)

骂韩少的前15高频情绪性用词的词频分析:第一位是“差”,第二位是“骗子”

(韩)差 (20.0%)
(韩)骗子 (17.9%)
(韩)不尊重 (14.3%)
不相信(韩) (8.6%)
不喜欢(韩) (5.7%)
(韩)造假 (5.0%)

问:你的机器看得懂谁是撒旦海珊吗?
能,社会评价度低于零下70度是人民公敌,天怒人怨,等价于撒旦。:=)
小方还好,才零下41度。
系统里面有一个对译词表
台湾译名与大陆译名不一致的在这里统一:

萨达姆:撒旦海珊 // Saddam Hussein
萨芬:沙芬 // Marat Safin
舒马赫:舒麥加 舒馬克 // Michael Schumacher
迈克尔:米高 麥克 // Michael Schumacher
斯大林:史達林 史太林 // Stalin
托洛茨基:托洛斯基 // Trotsky
……

http://blog.sciencenet.cn/blog-362400-610560.html

此条目发表在自然语言处理分类目录。将固定链接加入收藏夹。

发表评论

电子邮件地址不会被公开。 必填项已用*标注