皮书说|2022年社会团体与基金会网络舆情分析报告(上)
来源:国家治理与人才发展研究
作者:UCASS治理现代化
2024-02-23
676


编者按


中国社会科学院大学国家治理现代化与社会组织研究中心致力于采用实证、理论等研究方法,对国家治理体系和治理能力现代化进行理论及实务研究,并对相关理论文章及科研成果进行分享。   

    

2023年11月5日,《社会组织蓝皮书:中国社会组织报告(2023)》作为中国社会科学院大学国家治理现代化与社会组织研究中心的重要学术成果在京发布。现将《社会组织蓝皮书:中国社会组织报告(2023)》逐篇推送,以飨读者。




实证篇:

2022年社会团体与基金会网络舆情分析报告


课题组成员

任韬:首都经济贸易大学统计学院教授,博士生导师,主要研究方向为经济统计学、大数据分析;

宋子琨:首都经济贸易大学统计学院博士研究生;

侯思思、李艺琳、岳绪同、何宇馨:首都经济贸易大学统计学院硕士研究生。


一、引言


目前,我国的社会组织包括社会团体、基金会和民办非企业单位,这些组织在社会中具有较高的知名度和广泛的社会影响力。每年都会产生大量与社会团体和基金会相关的网络舆情,反映了人民群众对它们工作的评价,也从侧面揭示了我国社会治理中存在的问题。因此,对社会团体和基金会的网络舆情展开分析具有重要意义。首先,网络舆情分析有利于收集和反馈意见。通过监测社交媒体、在线论坛和新闻报道等渠道的舆情,可以广泛收集到公众的意见和观点,更好地了解公众的需求和期望。其次,网络舆情分析有助于问题预警和危机管理。社会团体和基金会可以通过舆情分析及时发现和跟踪与其相关的问题和争议,并进行预警和危机管理。最后,网络舆情分析有助于决策支持和战略规划。分析舆情数据,可以为社会团体和基金会的决策制定和战略规划提供数据支持。了解公众的关注点、热点话题和需求,可以指导组织的发展方向和战略重点。


总之,网络舆情分析对社会团体和基金会具有重要意义,可了解公众需求、预警危机、支持决策、引导舆情、管理声誉,提升形象和影响力。本报告针对2022年社会团体与基金会在新浪微博上的网络舆情进行热度、情感、主题和专题分析,以科学全面地评估情况。


报告的后续内容如下:第二部分介绍资料来源和获取途径;第三部分通过微博数、点赞数、评论数和转发数对2022年社会团体和基金会的网络舆情进行热度分析,揭示舆情热度变化趋势和热点事件;第四部分进行情感分析,比较2022年与2020年、2021年的情感结构和趋势,分析正负面微博的词频和高热度组织的相对情感值;第五部分进行主题分析,解析每个主题的含义,并结合情感分析结果分析负面舆情;第六部分针对2022年热点事件,如新冠疫情和重大体育赛事,进行专题分析,绘制情感结构和趋势图,并重点分析负面舆情;第七部分总结报告成果,并提出政策建议。



二、数据获取与分析过程


(一)资料来源


本报告选用微博平台作为数据的来源,微博是中国较具有权威性的社交评论网站之一,其用户基数大、讨论范围广,文博博文阅读和发布速度快,具有较强的传播影响力,是国内民众发声的重要平台。


在确定网络爬虫所依据的关键词后,本报告使用民政部社会组织管理局2021年12月27日发布的《2020年度全国性社会组织评估等级公告》中的社会团体与基金会名称作为关键词。最终确定社会组织关键词名单共94个,其中基金会44个、社会团体50个(见表1)。


(二)数据获取


本报告利用网页爬虫技术抓取自2022年1月1日至2022年12月31日期间94个社会组织关键词的微博信息,共抓取7个指标,分别是关键词、发博用户、发博时间、博文内容、点赞数、评论数、转发数。最终爬取到266913条数据,其中社会团体有96037条数据,基金会有170876条数据(见表2)。



对比2022年与2020年、2021年数据量,社会团体与基金会的数据量持续减少,主要是因为随着新冠疫情得到控制,人民生产生活基本恢复正常,总体经济运转较为稳定,社会团体与基金会也恢复到了疫情前的状态,相较于疫情初期,其活跃程度大大降低。抓取数据的某一个样本如下(见表3)。



(三)分析方法与过程


本报告针对基金会与社会团体的相关微博进行四个方面的分析工作,包括热度分析、情感分析、主题分析和年度热点专题分析,具体的分析方法和过程如下。


1.热度分析


在热度分析部分,首先按照周粒度对时间进行聚合,并绘制聚合后的微博数、点赞数、评论数和转发数的各指标热度趋势图,通过热度峰值找到对应的热点事件。继而基于以上各指标对相关社会团体与基金会进行排序,并且将2022年与2020年、2021年排名进行对比。


2.情感分析


在情感分析部分,首先对每条微博进行情感打分,根据得分添加情感标签(情感得分>0.5为正面情感,否则为负面情感),以正负情感比的对数构造相对情感值,并绘制社会团体与基金会全年情感走势图。通过对正负情感微博数进行统计,绘制社会团体与基金会全年情感结构图和正负微博数走势图。然后,统计社会团体与基金会正负面微博中的词频情况,并展示其中意义明确的前20个词语。最后,计算年度相对情感值,展示高热度社会团体与基金会的情感状态。


3.主题分析


在主题分析部分,首先对社会团体与基金会的相关微博内容进行数据清洗;接着建立LDA主题模型,以高频词为依据概括出主题的含义;最后结合情感分析结果,对负面舆情进行分析。


4.专题分析


该部分将根据前面分析的结果,确定2022年度的热度专题,并筛选出相关微博;接着对各专题进行热度分析并筛选出热点事件;最后对各专题进行情感分析,将情感结构与相对情感值走势进行可视化展示,并针对负面舆情进行分析。


三、热度分析


本报告以周度为时间粒度绘制社会团体和基金会微博数、评论数、转发数与点赞数四个指标的热度趋势图,定位年度热点事件以及各指标的热度排行榜。


(一)社会团体相关微博热度分析


以周度为时间粒度绘制社会团体在微博数、点赞数、评论数与转发数这四个指标上的热度趋势图(见图1)。从图1中可以观察到,社会团体的微博数周热度的量级在千条左右,最高达到3000余条。对比近三年的微博数趋势图(见图2),2020年的微博数趋势图有较强的波动性,2021年则较为平稳,而2022年的微博数热度趋势图有一个缓慢上升的趋势,且波动性更强。



12月,社会团体网络舆情热度高主要是因为疫情放开政策,其中相关的社会团体包括中华医学会与中国医院协会等。2022年2月,中国举办冬季奥运会、11~12月卡塔尔世界杯、对中国女足和谷爱凌等运动员的嘉奖等,掀起了全民运动的高潮。


综合点赞数、评论数和转发数这三个指标的热度峰值出现的时点和对应的微博内容可以确定2022年在网络舆情方面与社会团体相关的热点事件(见表4)。



本报告得到各指标热度总量排名在前五的社会团体名单(见表5、图3),以及各指标热度峰值排名在前五的社会团体名单(见表6、图4)。



从热度总量的情况可以观察到(见表5、图3),中国消费者协会2022年在微博数、点赞数和评论数的热度总量排名都是第一,转发数的热度总量排名第四,这是因为食品安全和消费者权益是广受关注的问题,再加上“3·15打假行动”,食品安全和消费者权益话题的影响力非常广泛。


中华医学会、中国足球协会、中国滑冰协会等由于自身话题的影响力高,这些社团涉及“疫情放开政策”“冬奥”“运动”等关键词大多与民众生活密切相关。微博数排名变动特别大的社会团体是中国营养学会,这主要是因为2022年反复出现的疫情以及年末的“疫情放开政策”。


从热度峰值的情况(见表6、图4)可以观察到,中华医学会受新冠疫情封控逐步放开政策的影响,各指标的峰值排名都有非常大的提升。




(二)基金会相关微博热度分析


以周度为时间粒度绘制基金会在微博数、点赞数、评论数与转发数这四个指标上的热度趋势图(见图5)。




从图5中可以观察到,基金会的微博数周热度的量级在千条,最高达到了8000余条且全年具有波动性。对比近三年的微博数趋势图(见图6),2020年与2021年的基金会微博数的热度趋势图都有较强的波动性,而相比之下2022年的微博数的热度趋势图较平稳。根据各指标的热度趋势图看出,2022年的3~5月的基金会网络舆情热度整体较高。综合点赞数、评论数与转发数这三个指标的热度峰值出现的时点和对应的微博内容可以确定2022年在网络舆情方面与基金会有关的热点事件(见表7)。



为了进一步观察基金会舆情热度水平,本报告得到各指标热度总量排名在前五的基金会名单(见表8、图7),以及各指标热度峰值排名在前五的基金会名单(见表9、图8)。


从热度总量的情况可以观察到(见表8、图7),有一些基金会的网络舆情热度高是由于本身的话题量大,因此自身话题的影响力较为广泛,例如:中国绿化基金会、中国扶贫基金会等,这些基金会热度高是受到明星担任形象大使影响。值得注意的是基金会的评论数和转发数在3月都远超100万条,远超其他月份的评论数和转发数,主要是因为中国绿化基金会在3月发起活动“百万森林公益项目”。





从热度峰值的情况(见表9、图8)可以观察到,中国绿化基金会受“百万森林公益项目”活动的影响,各指标的峰值排名都有非常大的提升。




四、情感分析


本报告从微博情感倾向、情感词频分析以及高热度社会组织的情感状态三方面分别对2022年社会团体与基金会的相关微博进行情感分析,并与2020年、2021年情况进行对比。本部分将计算相对情感值作为反映情感水平的指标,计算方式如下:

相对情感值大于0,说明整体情感水平呈正向;相对情感值小于0,说明整体情感水平呈负向;相对情感值等于0,说明整体情感水平呈中性。相对情感值的绝对值越大,说明表达的情感越强烈。


(一)社会团体相关微博情感分析


1.整体情况


为观察2022年社会团体相关微博的情感走势,以及与2020年、2021年的情况进行对比,本报告对社会团体的正负情感微博数进行汇总,并计算相对情感值,得到2022年与2020年、2021年社会团体相关的微博的整体情感结构对比图(见图9上)、走势对比图(见图9下)、2022年社会团体正负情感微博数走势图(见图10)。


由情感结构对比图可知(见图9上),2022年社会团体的正面情感微博数占比为47.79%,负面情感微博数占比为52.21%,与2020年、2021年相比,正面情感微博数占比大幅下降,负面情感微博数倍数上升。由情感走势对比图可知(见图9下),2022年的相对情感值的波动性较大。相较于2020年、2021年,2022年的相对情感值的均值较低,说明2022年社会团体的负面情感微博数较多。




由图10可知,2022年社会团体的正面情感微博数与负面情感微博数的走势情况大体相同,负面情感微博数的波动性更大。在2022年3月和11月,负面情感微博数出现了峰值,主要与消费者权益有关。


2.情感词频分析


对社会团体正负面情感微博中出现的正面情感微博词频较高的前20个词语(见表10)与负面情感微博词频较高的前20个词语(见表11)进行展示。


从表10中可以看出,2022年社会团体正面情感微博的高频词主要与发展、研究、服务、文化、健康等相关,其中产业发展、技术研究在2021年与2022年均得到了广泛关注。



从表11中可以看出,2022年社会团体的负面情感微博的高频词主要与消费者权益、服务管理、价格监管等有关,与2020年、2021年相比,消费者权益问题得到了更为广泛的关注。


3.高热度社会团体情感状态分析


对微博数热度总量排名前五的社会团体以年度相对情感值为依据进行降序排列,分析高热度社会团体的情感状态(见表12)。



如表12所示,2022年网络舆情热度高的社会团体,大部分其年度相对情感值为正,其中只有中国消费者协会的年度相对情感值为负,主要原因在于公众在消费过程中遇到问题通过网络平台进行反映,且每年“3·15”会揭露侵犯消费者权益的事件,由此会出现负面舆情。2022年该方面事件涉及校外培训、网络游戏和个人信息保护等多个方面。但是这些并非针对中国消费者协会,相反,这体现了中国消费者协会履行其宗旨,对消费市场规范发展起着重要作用。


(二)基金会相关微博情感分析


1.整体情况

为观察2022年基金会相关微博的情感走势,以及与2020年、2021年的情况进行对比,本报告对基金会的正负情感微博数进行汇总,并计算相对情感值,得到2022年与2020年、2021年基金会相关的微博的整体情感结构对比图(见图11上)、走势对比图(见图11下)、2022年基金会正负情感微博数走势图(见图12)。


2022年基金会的正面情感微博数占比为99.00%,负面情绪微博数占比为1.00%,与2020年、2021年相比,正面情绪微博数占比有所上升。与2020年、2021年相比,2022年的相对情感值的平均水平较高,整体趋势比较平稳。由图12可知,2022年基金会的正负面情感微博数波动均较大。在2022年5月和9月,负面情感微博数出现了峰值,这主要与“先心病儿童的‘心’生”项目和“联合辟谣”活动有关。


2.情感词频分析


与整体情况的分析结果相结合,分别统计基金会正负面情感微博中出现的高频词,并从中选取对本次分析有意义的正面情感微博词频较高的前20个词语(见表13)与负面情感微博词频较高的前20个词语(见表14)进行展示。



由表13可知,2022年的基金会正面情感微博的高频词主要与公益活动、环境保护、动物保护和扶贫工作等有关。



从表14中可以看出,2022年基金会负面情感微博的高频词主要与公益项目和社会发展、公司和企业管理、儿童健康和妇女权益有关。


3.高热度基金会情感状态分析


对微博数热度总量排名前5的基金会以年度相对情感值为依据进行降序排列,分析高热度基金会的情感状态(见表15)。



如表15所示,2022年网络舆情热度高的基金会,其年度相对情感值均显著为正,2020年和2021年的年度相对情感值也均显著为正,说明基金会在近三年一直发挥了重要作用,且公众对其整体表现评价非常积极。


(由于篇幅过长,本报告将分成两部分依次推送)


发布评论
文明上网理性发言,请遵守评论服务协议
表情
全部评论
0条
最新 最热
加载更多