基于微博文本数据的抑郁倾向检测研究

社交网络应用中的”抑郁症社区”是一种为社区成员提供信息发布和社交互动的平台。成员活动产生的大量媒体信息及成员间的互动痕迹为网络社会中抑郁倾向的检测与识别提供机遇。基于机器学习技术构建的分类模型,采用有监督学习(Supervised Learning)的方法,以人工标注的方式实现对社交网络中与抑郁症症状、情绪等相关的帖子进行分类、识别。本研究主要工作:(1)抽取新浪微博在2018-2022年公开发布在”抑郁症社区”的帖子285826条,编制了一个全新AZD9291 MW的社交网络抑郁倾向标注方案,为社交网络中存在抑郁倾向的帖子提供更好的匹配。(2)由两名心理咨询领域研究者根据标注方案标注部分数据集,采用深度学习(Deep Learning)训练,对已标注数据构建文本分类模型,实现了抑郁倾向帖子的检测、识别,最后对其识别准确率做出评估。(3)采用文本分析(Text Analysis)技术,统计发帖频率及对应时间区间的词频,以时间为单位呈现了抑郁症社区中发帖数量随时间波动的变化。结果发现,深度学习模型具有较高的检测准确率;抑郁症社区近五年的帖子发布频率呈先增长后下降的趋势,并于2020、2021年间趋于平稳,继而在2022年初极速增长并达到高峰,此外,研究还发现除了自我情绪表达相关词汇以外,”别人”、”大家”和”朋友”等词汇出现频率较高。结论:基于深度学习的分类模型具有较好的预测效Nosocomial infection果,社交媒体数据可PF-02341066纯度以对个体的抑郁倾向进行有效预测;人际关系是抑郁症社区成员活动痕迹中较为重要的一个因素;抑郁症社区成员的活动随时间节点具有特定变化规律,未来需要进一步探索与其结果的关系和背后的机制。