首页 > 科技快讯 > 人类的悲欢虽不相通，但情感分析模型读得懂

人类的悲欢虽不相通，但情感分析模型读得懂

晰数塔互联网快讯
2021-02-01 15:41

编者按：本文来自微信公众号“HyperAI超神经”（ID:HyperAI），作者：神经小兮，36氪经授权发布。

内容提要：社交媒体逐渐成为当今人们生活的一部分，而它也成为心理学家们进行研究的重要数据来源。与此同时，研究者也尝试利用自然语言处理、机器学习技术，来预测社交媒体用户的情绪波动。

关键词：自然语言处理心理学

去年突如其来的新冠疫情，深刻地影响着人们的生活。这一特殊的历史时期，社会大众的心理都变得敏感脆弱。

疫情期间减少外出和接触，使得民众把更多时间花在社交网络上。有些人不可避免地将工作和生活中的不如意，通过网络发泄给了别人。恐慌、焦虑、悲伤、无助等不良情绪也有所加重。

面对突发公共事件，社交媒体用户普遍出现了

包括愤怒、害怕、担心、迷惘、悲伤等负面情绪

据调查显示，全球互联网用户平均每天花在社交媒体上的时间，达到 2 小时 22 分钟，社交媒体已经不限于社交功能，它们还成为了很多人记录心情、倾诉心事的阵地。

无论是国内的微信朋友圈、微博、QQ 空间等，还是国外的 Twitter、Instagram、Facebook，都承载了万千用户的状态。

而对于心理学研究者来说，这些社交媒体上的帖子，无疑为其提供了数量可观的研究数据。

来自斯坦福大学的研究员 Johannes Eichstaedt 和密歇根大学的 Aaron Weidman，在其最新研究中，使用自然语言处理工具，对 Facebook 用户的帖子进行分析。

研究表明，机器学习模型可以通过社交媒体洞察一个人的情绪与波动，其准确度与传统心理学的度量结果相当。

从字里行间，读懂你的喜怒哀乐

近年来，网络上的大量资料，已经成为人格科学中一个重要的数据来源。大量的研究表明，使用社交媒体资料，对人格相关维度进行分类十分有效。

Eichstaedt 和 Weidman 的最新研究，则为利用社交媒体大数据分析、跟踪人的心理状态，提供了一个前沿案例。

使用社交媒体语言跟踪心理状态的波动：

基于每周情绪波动的案例研究

取样校准

作者使用「效价」和「唤起」这两个基本情绪维度，来评价 Facebook 上帖子的情绪。

注：「效价」和「唤起」是心理学中评价情绪的两个维度，前者表示感受到的积极/消极程度，区分正面和负面情绪；后者表示冷静/兴奋的程度。

他们首先让已经有心理学研究基础的人类研究助理，给一项早期研究中的 2895 条公开 Facebook 帖子做注释。

研究助力给每一条帖子的「效价」（valence）和「唤醒」（arousal）进行打分。采用 9 分制（对于「效价」，1=「消极」，9=「积极」，同样地，对于「唤起」，1=「低」，9=「高」）。

心理学研究助理为帖子所作出的「效价」和「唤起」注释

该情绪跟踪数据集已经公开：https://osf.io/pbjer/files/

完成这些评价之后，这些帖子被用于训练机器学习模型，该模型将能够预测哪种语言传达了哪种情感。

然后作者对这些评分数据进行了一系列模型的拟合，每一个模型都显示，「效价」和「唤起」之间可能存在的明显联系。

对于国内的 NLP 研究者来说，中文情感分析数据集则更为适用。因此，超神经为大家推荐一个来自 2014 NLPCC 的中文微博情感分析数据集。

该评测数据来自新浪微博，对于输入的整条微博，任务要求判断出该微博是否包含情绪。对包含情绪的微博，要求判别其情绪分类输出为 anger（愤怒）、disgust（厌恶）、fear（恐惧）、happiness（高兴）、like（喜好）、sadness（悲伤）、surprise（惊讶）。

数据集详细信息如下：

中文微博情感分析数据集

数据提供：NLPCC2014

发布时间：2014 年

包含数量：数十万微博文本

数据格式：.xml

数据大小：18 MB

下载地址：https://hyper.ai/datasets/14390

模型创建

团队使用差异语言分析工具包 DLATK（Differential Language Analysis ToolKit），提取所选 Facebook 帖子中的语言特征，根据单词、短语出现的相对频率，保留了比偶然出现的短语频率高出三倍以上的词汇。最终过滤出 1439 个句子成分用来预测「效价」，675 个句子成分预测「唤起」。

接着，训练一个基于整个语言特征集的脊回归模型，来预测「效价」和「唤起」，并使用 10 倍交叉验证（即在 90% 的数据上建立模型，然后在剩余的 10% 上进行评估）。

该模型的交叉验证样本外预测准确率为：「效价」预测准确率 0.63；「唤起」准确率为 0.82。与之前其他标准的情感测量方法相比较，发现该模型比这些替代测量方法估计得更准确。

验证样本

为了测试该模型，研究团队又从超过 6.5 万条 Facebook 帖子中，抽取了 640 个美国用户，男女人数相当，还需要满足的条件为：至少连续 14 周的时间里，发布 10 条以上的状态。

最终，研究团队收集了这些用户发布的 303575 个帖子作为验证样本。

实验结果

作者对用户的情绪评价进行了可视化，如下图，描述了一个女性（左）和一个男性（右）的每周情绪和唤醒波动，以及五大人格特征预测。

注：五大人格特征是现代心理学中，用于人格特质描述的结构模型。包括：外向性、神经质、亲和性、尽责性和经验开放性。

横坐标为「效价」值，纵坐标为「唤起」值

从图中看到，左边的女性用户情绪波动较大，并且出现高度愉悦（Valence）、高度兴奋（Arousal）的频率较高。

相比之下，右边的男性用户，情绪波动较小，很少经历高度愉悦或高度兴奋的情绪。

这也是团队实验中的一个新发现：女性往往比男性更乐观、情绪变化范围更广。这与

另外，团队分析还发现了「效价」和「唤起」值和五大人格之间的相关性。

模型评估

提供验证样本的 Facebook 用户，之前都自愿参与了「我的性格」的问卷调查，测评了其五大性格特征。

结果显示，机器学习模型对他们性格的预测，与使用心理学调查方法的预测一致。

缺陷分析

当然，作者也指出了这一模型目前所存在的问题。

首先，他们以比较活跃的 Facebook 用户作为样本，但是之所以选择他们是因为他们提供了足够频繁的状态更新，但他们并不可能代表所有美国人。

其次，不同社交平台，具有不同的属性与风格，使用 Facebook 帖子所获得的成果，能否在不同社交媒体比如 Twitter 上进行复制，还是个未知数。

因此，这些局限性、普适性问题，也都是研究者未来要进一步探索的方向。

社交平台用于心理学，潜力无限

也许对于很多人来说，社交平台无非是一个分享生活、美照、看八卦的地方，但事实上它在心理学研究中拥有着巨大的潜力。

通过数据挖掘、机器学习，能够从巨量的数据中提取信号，识别出患有抑郁症、焦虑症等情绪障碍的人，然后及时采取一些治疗措施。在这方面，国内也已经有成熟案例。

荷兰阿姆斯特丹自由大学（Vrije Universiteit Amsterdam）人工智能学者黄智生，于 2018 年创建了一个叫做「树洞救援队」的 AI 程序，在微博上搜寻有自杀倾向的帖子，然后通过「蛛丝马迹」锁定有轻生念头的用户的位置，及时派出救援志愿者前去寻找和疏导。

现在这支有志愿者组成的小队，还活跃在心理疏导的一线。

截至 2020 年 9 月底，成立两年时间以来「树洞救援队」共阻止了 3289 次自杀行为

另外，基于社交媒体的情感分析技术，还可以追踪创伤性事件（比如大地震、战争、新冠肺炎疫情等），对人们的心理影响，从而帮助政府部门有效开展舆情疏导、科学施救和民众情绪的安抚工作。

而对于个人来说，也许未来可以利用这些工具，分析分析男/女朋友的小情绪呢，大家就再也不用猜来猜去了~

新闻来源：

https://hai.stanford.edu/blog/can-artificial-intelligence-map-our-moods

离谱！“死了么”APP突然火了，什么信号?

秦始皇开机甲战车？半月谈：别让AI魔改扭曲孩子认知

热点科技快讯

人类唯一的出路: 变成人工智能（五）

本文来自微信公众号：Wait But Why（ID：wbwtimurban），...

报告：抖音海外版下载量突破10亿大关挑战Facebook

新浪科技讯北京时间2月28日早间消息，据美国财经媒体CNBC援...

推荐科技快讯

移动办公如何高效？谷歌研究了两年，发现了这七个秘密

神译局是36氪旗下编译团队，关注科技、商业、职场、生活等领域，...

人类唯一的出路：变成人工智能（三）

本文来自微信公众号：Wait But Why（ID：wbwtimurban），...

热门点击排行

问界商标转让释放信号：赛力斯与华为合作持续深入

报告：抖音海外版下载量突破10亿大关挑战Facebook

科技快讯分类导航

互联网创业

人工智能

大数据分析

行业热点

人类的悲欢虽不相通，但情感分析模型读得懂

从字里行间，读懂你的喜怒哀乐

取样校准

模型创建

验证样本

实验结果

模型评估

缺陷分析

社交平台用于心理学，潜力无限

新闻来源：

离谱！“死了么”APP突然火了，什么信号?

秦始皇开机甲战车？半月谈：别让AI魔改扭曲孩子认知

人类唯一的出路: 变成人工智能（五）

报告：抖音海外版下载量突破10亿大关 挑战Facebook

移动办公如何高效？谷歌研究了两年，发现了这七个秘密

人类唯一的出路：变成人工智能（三）

报告：抖音海外版下载量突破10亿大关挑战Facebook