互联网大数据解读中国媒体经济信心

2015-12-28 12:00:00
admin
原创
摘要:民众经济信心指数是衡量民众对经济环境的信心强弱的指标,是综合反映并量化民众对当前经济形势评价和对经济前景、收入水平、收入预期以及消费心理状态的主观感受,是预测经济走势和消费趋向的一个先行指标,同时也是监测经济周期变化不可缺少的依据。

民众经济信心指数是衡量民众对经济环境的信心强弱的指标,是综合反映并量化民众对当前经济形势评价和对经济前景、收入水平、收入预期以及消费心理状态的主观感受,是预测经济走势和消费趋向的一个先行指标,同时也是监测经济周期变化不可缺少的依据1。经济学界通常认为,民众的行为并不是实际经济结构的被动反应者,他们的态度和预期会影响经济发展趋势,所有民众审慎决策的加总,就足以影响国民经济的发展趋势2。国外五十多年的理论研究和实践活动也表明,消费者的信心与重要宏观经济指标之间存在密切联系,它对未来经济发展趋势有相当的预见性,是宏观经济决策的重要参考3


1.如何测量中国民众经济信心指数

调查问卷是目前收集民众经济信心的重要方法。随着互联网的出现,特别是社会化媒体的普及,网络中包含了越来越多由用户或机构生产的信息,为民众经济信心的统计提供了新的数据源。且相较传统调查问卷数据,该类数据有采集简单、迅速等特点,可在一定程度上克服传统方法的不足。考虑到网络数据的特点,本报告主要从三个渠道采集数据(即百度指数、新浪微博、门户网站等),综合采用指数统计、内容分析、情感分析等方法进行数据分析,通过问题与数据的对应,进行民众经济信心的统计。


不同国家和机构在设计民众经济信心调查问卷时考虑的问题内容有所区别,但大多包含如下几个方面内容:即“经济发展”、“就业形势”、“家庭收入”与“消费意愿”。因此,本报告设计了如表1.1所示的四类八个问题进行本次中国民众经济信心的统计。另外,为了便于后面分析,将每个问题的答案从正向到负向统一命名,具体如表1.2所示。


本报告将对每类问题进行信心指数统计,具体计算过程如公式(1)所示,其中“总数”表示对应问题包含的文本数量,“乐观数”表示对应问题包含的表达乐观情感倾向的文本数量(微博文本或新闻报道),其它与之类似。另外,针对每类数据源(意见领域发表的微博文本、五大门户网站的新闻报道),将综合四类问题计算一个总的经济信心指数,该指数为四类问题信心指数的平均值。


2.民众在关注什么?关键词搜索变化趋势分析

以往关于经济信心指数的分析着重关注指数本身,忽略了表征经济信心的各个方面的问题。因此,在进行指数统计之前,有必要弄清针对四类问题民众的关注焦点及其变化趋势。考虑到“百度”在中国搜索领域的地位,本报告采用百度指数(http://index.baidu.com)作为统计民众关注焦点及其变化趋势的工具。具体过程如下所示:


①关键词的确定

针对每个问题的特点选择国家统计局、社会劳动保障部、购物网站等提供的分类目录,结合百度提供的关键词推荐功能和人工判断,为每个问题确定100-1000不等的表征关键词。


②关键词的分类

根据一定规则将每个问题对应的关键词分成数量不等的大类与小类,其中小类包含在大类中。


③关键词搜索变化趋势计算

首先,利用百度指数获取关键词今年与去年的搜索趋势,并据此得到关键词搜索变化趋势初始值;其次,考虑到相较2014年,2015年我国网民基数有所增加,对搜索变化趋势初始值进行加权,得到最终的关键词搜索变化趋势值。另外,值得一提的是:

“关键词搜索变化趋势值”>1表示相较去年,关键词今年搜索量增加;

“关键词搜索变化趋势值”<1表示相较去年,关键词今年搜索量减少;

“关键词搜索变化趋势值”=1表示相较去年,关键词今年搜索量基本不变。


④小类与大类搜索变化趋势计算

小类搜索变化趋势值为小类包含的关键词的搜索变化趋势值的平均值。

大类搜索变化趋势值则为大类包含的小类的搜索变化趋势值的平均值。


2.1“经济发展”类问题统计结果

首先,按照国家统计局对三次产业的划分,将国民经济划分为第一产业、第二产业和第三产业3个大类;其次,根据国民经济的《行业分类标准》,将农林牧渔业、建筑业、金融业等20个行业门类作为小类。《行业分类标准》中对20个行业门类都进行了细分,通过从细分门类中抽取关键词的方式来确定基础关键词集。通过百度指数的关键词推荐功能,对基础关键词集进行扩展。摒除掉百度指数中没有收录的部分关键词(不是“热词”),最终确定的关键词数量为:587个。最后,通过收集并计算小类搜索变化趋势值及其平均值,得到“经济发展”类问题的关键词搜索变化趋势(表2.1和图2.1)。

可以看出:

① 民众对于三大产业的关注度较去年均有所上升,按关键词搜索变化趋势,由高到低依次为第三产业、第一产业和第二产业。

②除“水利、环境和公共设施管理业”小类的关注度较去年有所下降之外,其他所有行业的关注度较去年均有所上升。

③ 民众关注度较去年上升幅度最大的前5个行业依次为金融业、房地产业、住宿和餐饮业、租赁和商业服务业、建筑业和教育。


2.2“就业形势”类问题统计结果

首先,将就业形势划分为就业与失业两类。其次,从人力资源和社会保障部的《政策法规》中提取与就业相关的关键词,结合百度指数的关键词推荐功能,对基础关键词集进行扩展。摒除掉百度指数中没有收录的部分关键词(不是“热词”),最终确定的关键词数量为:123个。根据就业类与失业类关键词的特点,将就业大类又分为“招聘”、“创业”、“公务员与事业单位”、“技能培训”与“保险与保障”五小类,失业大类仅包括“失业”一个小类。最后,通过收集并计算小类搜索变化趋势值及其平均值,得到“就业形势”类问题的关键词搜索变化趋势(表2.2和图2.2)。

可以看出:

① 无论关于就业还是失业,民众的关注度均较去年有所上升,其中就业的关注度上升幅度高于失业。

② 从关键词搜索变化趋势上看,民众最为关注的依次是招聘、公务员与事业单位、创业、技能培训、失业、保险与保障。


2.3“家庭收入”类问题统计结果

首先,由于直接确定“家庭收入”类问题的表征关键词较困难,同时考虑到家庭收入主要用于家庭支出,因此本文将“家庭支出”作为“家庭收入”的表征。家庭支出分为“必需品”与“非必需品”两大类。其中“必需品”分为服装、食品、住房、交通、医疗、通讯6小类,“非必需品”分为“3C ”、奢侈品、汽车、投资、教育、娱乐、大家电、旅游8小类。其次,通过百度指数的关键词推荐功能,对基础关键词集进行扩展。摒除掉百度指数中没有收录的部分关键词(不是“热词”),最终确定的关键词数量为:196个。最后,通过收集并计算小类搜索变化趋势值及其平均值,得到“家庭收入”类问题的关键词搜索变化趋势(表2.3和图2.3)。

可以看出:

① 必需品的搜索变化趋势值(1.16)小于非必需品的搜索变化趋势值(1.61),说明民众对非必需品的关注度上升幅度高于必需品,可能表明民众收入更多地流向非必需品。

②在非必需品的八个小类中,投资的搜索变化趋势值为4.99,远远高于其他关键词集,表明今年民众对投资领域的关注度大幅提升。

在所有14个小类中,必需品中的“住房”和非必需品中的“3C”两个小类的搜索变化趋势值均小于1,表明民众今年对这两方面的关注度有所下降。


2.4“消费意愿”类问题统计结果

首先,人工分析消费者的购买行为和习惯,将消费品分为“便利品”、“选购品”、“特殊品”、“非渴求品”四大类。其次,根据国家统计局提供的商品零售价格分类指数,并辅之以人工分析,将四大类细分为包括“食品”、“饮料烟酒”、“日用品”等在内的21个小类。通过从21个小类中抽取关键词的方式来确定基础关键词集,利用百度指数的关键词推荐功能,对基础关键词集进行扩展。摒除掉百度指数中没有收录的部分关键词(不是“热词”),最终确定的关键词数量为:1153个。最后,通过收集并计算小类搜索变化趋势值及其平均值,得到“消费意愿”类问题的关键词搜索变化趋势(表2.4和图2.4)。

可以看出:

① 四类商品的搜索变化趋势值均大于1,表明民众对这四类商品的关注度较去年均有所上升。

②体育娱乐用品、家用电器及音像器材与化妆品三个小类的搜索变化趋势值小于1,中西药品及医疗保健用品与书报杂志及电子出版物两个小类的搜索变化趋势值等于1,说明体育娱乐用品、家用电器及音像器材与化妆品的关注度小于去年,而中西药品及医疗保健用品与书报杂志及电子出版物的关注度与去年类似。

③证券的搜索变化趋势值远远高于其他小类,说明今年与证券有关的关键词的搜索量增幅较大。


2.5部分小类的百度指数详细统计

本部分将对几个表征经济信心能力强且搜索变化趋势特别的小类进行单独分析,获取每个小类在2015年1月到11月的百度搜索指数,绘制搜索指数变化图。


⑴“失业”小类的百度指数分析

图2.5是失业小类的百度指数变化趋势图。从图2.5可以看出,失业小类的搜索指数在3月份出现峰值。

⑵“投资”小类的百度指数分析

图2.6是投资小类的百度指数变化趋势图。从图2.6可以看出,投资小类的搜索指数在7月份出现峰值。

⑶“3C”小类的百度指数分析

图2.7是包含智能手机、平板电脑等在内的3C小类的百度指数变化趋势图。从图2.7可以看出,3C小类的搜索指数在7月份出现峰值。

⑷“住房”小类的百度指数分析

图2.8是住房小类的百度指数变化趋势图。从图2.8可以看出,住房小类的搜索指数在3月份出现峰值。

3.意见领袖对中国经济信心的统计分析

传播学理论发现,意见领袖作为媒介信息和影响的中继和过滤环节,对大众传播效果会产生影响4。因此,意见领袖的观点也可能会对民众产生一定影响,考虑将其纳入分析范围。


3.1数据来源与处理方法

首先,选择“新浪微博”为数据获取平台,以新浪搜索的“找人”为检索入口,分别以“经济”、“就业”、“收入”、“消费”等作为检索词进行检索;

其次,在检索结果中综合考虑博主的粉丝数、职业、身份等信息,共选定35名博主作为意见领袖;

然后,进入意见领袖在新浪微博的个人主页,浏览其一年里所发微博内容,筛选出与问题相关的微博文本共210条。对这些文本进行问题分类,发现针对“就业形势”与“家庭收入”类问题的微博文本数较少,前者17条,后者8条,共25条,不具备代表性,考虑将其删除。

最后,对185条微博文本进行情感分析,并与问题的答案进行对应。基于此,进行两类问题信心指数(即“经济发展”与“消费意愿”)与总的经济信心指数计算,并对计算结果进行详细分析。


3.2统计结果与分析

首先,统计每类意见领域发表微博文本的情感倾向,并进行各类问题信心指数计算与意见领域总的经济信心指数计算,得到如表3.1与图


3.1所示的结果:

综合分析得到:

①分析每类问题包含的微博文本数可知,意见领袖对“经济发展”类问题最为关注,“家庭收入”类问题相对关注较少;

②针对两类问题,意见领袖对“经济发展”最有信心,“消费意愿”次之。

其次,以问题为维度制作意见领袖情感倾向分布图,如图3.2与3.3所示:

4.五大门户网站新闻报道对中国经济信心的

统计分析

门户网站是网络时代民众获取信息的重要渠道,而新闻报道依托于平台本身的权威性与传播性能在很大程度上对民众的观点产生影响。因此本报告将主要门户网站上与经济信心相关的新闻报道纳入分析范围,并通过情感分析获取相关报导的情感倾向,计算四类问题与总的经济信心指数,以期为民众经济信心分析提供支持。


4.1数据来源与处理方法

首先,选择五大门户网站(新浪、凤凰、网易、腾讯、搜狐)作为数据获取平台;

其次,利用各个门户网站提供的搜索功能,以“经济发展”、“就业形势”、“家庭收入”、“消费意愿”为关键词,分别在五大门户网站检索,选取有效检索结果的前150名,共3000条新闻为分析对象;

最后,分析3000条新闻的情感倾向,并进行结果的统计与分析。值得一提的是,这部分数据将分成“当前”问题与“未来”问题分别统计。


4.2统计结果与分析

统计结果将以两种形势展示:

首先,是四类问题总的统计结果;

其次,将四类问题“当前”与“未来”的分别统计结果。


⑴总体统计结果

综合分析表4.1与图4.1得到:

①根据总的经济信心指数可知,五大门户网站相关新闻报道对中国的经济信心持乐观态度;

② 根据四类问题的信心指数可知,五大门户网站相关新闻报道对中国经济发展、家庭收入与消费意愿持乐观态度。

⑵四类问题“当前”与“未来”分别统计结果

这部分数据将分成“当前”与“未来”分别统计。统计结果如表4.2和图4.2a-4.5b所示。

综合分析得到:

①从五大门户网站相关新闻报道数量看,有1887条关注了当前的经济状况,而有1113条关注了未来的经济状况,即关注“当前”的新闻报道更多。

② 在关注当前经济状况的1887条新闻中,关于就业形势的报道最多,其次是家庭收入,再次是消费意愿,最后是经济发展。而在关注未来经济状况的1113条新闻中,报道最多的是经济发展,其次是消费意愿,再次是家庭收入,最后是就业形势。说明对“当前”和“未来”的关注点是不同的。五大门户网站相关新闻报道更加关注未来的经济发展,而当前则更加关注诸如就业、消费等与民众切身利益相关的问题。

③ 从“当前”与“未来”的经济信心指数看,五大门户网站相关新闻报道不仅对当前经济信心持乐观态度,并且对未来更加有信心。

④ 分析四个问题“当前”与“未来”的统计结果可知,五大门户网站相关新闻报道对“当前”的家庭收入最乐观,其次是消费意愿,再次是经济发展;对“未来”的经济发展最乐观,其次是就业形势,再次是家庭收入。

考察“当前”与“未来”信心指数的差值可以发现,五大门户网站相关新闻报道对经济发展和就业形势具有最为积极的期待。


5.结语

本报告以互联网数据为分析对象进行2015年中国民众经济信心指数统计分析,得到以下发现:第一,利用百度指数对表征四类问题的关键词进行搜索变化趋势计算,发现相较去年,“投资”与“证券”两个小类今年的网络搜索量大幅增加。由此可知,今年民众对于投资、证券、股票等较为关注;第二,意见领袖对经济发展持乐观态度;第三,五大门户网站对中国当前与未来的经济信心都呈现乐观态度,由其是对于未来更有信心。

随着中国经济发展进入新的阶段,民众消费对经济发展的重要性不断增加。民众经济信心指数是衡量民众未来消费意愿的重要指标,本报告通过对网络大数据进行统计分析发现,无论是微博上的意见领袖还是门户网站中各种新闻报道,总体上呈现出的都是对未来经济发展持乐观态度。这种乐观态度将为未来中国经济的发展提供充足动力。


注:

1参见国家统计局中国经济景气监测中心:http://www.cemac.org.cn/Gxfzxx.html

2国家统计局中国经济景气监测中心.消费者信心调查方法与应用[EB/OL].[2015-12-20]. http://www.ce.cn/cysc/ztpd/zt/bg/X/201011/16/t20101116_20544836.shtml。

3李晓玉:《消费者信心指数的理论背景与实际意义》,《统计教育》2006年第1期。

4Lazarsfield P, et al., The People’s choice[M]. New York: Columbia University Press, 1948.

    发表评论
    评论通过审核后显示。