人文社科领域调查数据来源分析
- 2018-11-08 09:43:00
- 孙娜娜 原创
在人文社科类学术研究中,大量的数据支撑是学术研究得出可靠结果的保障。本文从社会综合、居民收入状况、老年人口问题、劳动力问题四个方面介绍了当前可以快速得到的 11 类微观调查数据,如中国社会状况综合调查、中国家庭收调查、中国健康退休跟踪调查、全国流动人口动态监测调查数据等,其中就有小锐与中山大学合作的中国劳动力动态调查(China Labor-force Dynamic Survey,CLDS),这是全国第一个以劳动力为主题的全国性跟踪调查。
01
社会综合类调查数据
1.中国社会状况综合调查。
中国社会状况综合调查(Chinese Social Survey,CSS),是由中国社会科学院社会学研究所 2005 年发起的一项全国性的连续性抽样调查项目,每两年开展一次,旨在研究我国的劳动就业、家庭及社会生活、社会态度等方面的情况。该调查采用概率抽样的入户访问方式,调查区域覆盖全国31 个省(自治区、直辖市),包括 151 个区市县,604 个村/居委会,每次调查访问 7000~10000 多个家庭。为考虑调查的连续性和社会发展情况,CSS的调查问卷在设计上分为基础模块、更替模块和热点模块 3 个部分。每期调查结束的两年之内,项目组都会将原始数据免费向全社会开放。
2.中国综合社会调查。
中国综合社会调查(Chinese General Social Survey,CGSS),是由中国人民大学和中国调查与数据中心负责,自 2003 年起,每年一次,对 31 个省(直辖市、自治区)的 1 万多户家庭进行的连续性横截面调查,是我国最早的全国性、综合性、连续性学术调查项目。它的目的是系统、全面地收集社会、社区、家庭、个人多个层次的数据,包括行为、态度以及生活、工作的基本信息。CGSS的调查问卷由三部分构成。一是核心模块:调查全部样本,年度调查,固定不变。二是主题模块:调查全部样本,5 年重复一次,两次调查内容重合率大于 80%。三是附加模块:调查 1/3 或 1/4 随机样本,不确保重复周期和内容。CGSS 的数据在每次年度调查结束两年后,向全社会公布原始数据和所有资料。
3.中国家庭动态跟踪调查。
中国家庭动态跟踪调查(China Family Panel Studies,CFPS),由北京大学中国社会科学调查中心组织实施,每两年一次,旨在研究中国居民的经济与非经济福利、经济活动、教育水平、人口迁移、健康状况等问题。CFPS 在 2008 年、2009年在北京、上海、广东分别进行了初访与追访的测试调查后,2010 年正式进行调查。经 2010 年基线调查界定出来的所有基线家庭成员及其今后的血缘、领养子女将作为 CFPS 的基因成员,成为永久追踪对象。CFPS 的样本覆盖全国(除中国港澳台、新疆、西藏、青海、内蒙古、宁夏和海南之外的)25 个省(直辖市、自治区),样本规模为 1.6 万户,调查对象包含样本家户中的所有家庭成员。目前,2012 年、2014 年、2016 年已经进行了三轮追踪调查。通过与调查中心签订协议,可以获取调查数据。
02
居民收入状况调查数据
1.全国住户收支与生活状况调查。
全国住户收支与生活状况调查是国家统计局重要的调查之一,通过在全国抽样框基础上,随机抽取部分住户进行入户调查,了解我国居民的收支与生活状况。调查样本包括分省住户调查样本和分市县住户调查样本。调查采用分层、多阶段随机抽样方法抽选调查住宅,抽中的调查小区 5 年轮换一次,住宅每半年轮换一次。在 95%的置信度下,确保单个指标的抽样误差控制在 3%以内,汇总数据的抽样误差控制在 1%以内。全国住户收支与生活状况调查数据按年或者季度进行公布。
2012 年国家统计局对原来分开组织实施的农村住户调查和城镇住户调查实施了一体化改革,统一了抽样方法、指标口径等。《中国住户调查年鉴》收录了相关数据,其中 2013 年及以后的数据来源于全国住户收支与生活状况调查,2012 年及以前数据来源于分别开展的城镇住户抽样调查(Urban Household Survey,UHS)和农村住户抽样调查(Rural Household Survey,RHS)。
2.中国家庭收入项目调查。
中国家庭收入调查(Chinese Household Income Project Survey,CHIP),由北京师范大学中国收入分配研究院联合中外学者组织,国家统计局等协助实施的调查项目,旨在追踪中国的收入分配变化情况。截至目前已经进行了 6 次入户调查,分别是 1988 年、1995 年、2002 年、2007 年、2008 年和 2013 年。CHIP 数据包含城镇住户调查和农村住户调查,2002 年开始增加了对流动人口调查。
同时,CHIP2007、CHIP2008 年的调查也是 RUMiC(中国的农村—城镇移民项目)的组成部分,记为RUMiC2008、RUMiC2009。CHIP2013 的样本来自国家统计局 2013 年城乡一体化常规住户调查大样本库,涵盖全国 31 个省(直辖市、自治区)的 16 万户居民,按照东、中、西分层,采用系统抽样方法抽取样本,得到城镇住户 7175 户、农村住户 11013 户和外来务工住户 760 户。数据内容包括住户个人层面的基本信息、就业信息,以及家庭层面的基本信息、收支信息等。目前,该数据可以在中国收入分配研究院网站 ① 免费下载。
3.中国家庭金融调查。
中国家庭金融调查(China Household Finance Survey,CHFS)是中国家庭金融调查与研究中心在全国范围内开展的抽样调查项目,旨在收集有关家庭金融微观层次的相关信息,主要内容包括:住房资产与金融财富、负债与信贷约束、收入与消费、社会保障与保险、代际转移支付、人口特征与就业以及支付习惯等。该调查分别在2011年、2013 年和 2015 年进行了三次调查。2011 年调查的有效样本共 8438 户,分布在全国 25 个省(直辖市、自治区),80 个县,320 个村(居)委会,数据具有全国代表性。2013 年调查的有效样本共2.8 万户,样本分布在全国 29 个省(直辖市、自治区),262 个县,1048 个村(居)委会,数据具有全国和省级代表性。2015 年调查的有效样本共 4 万户,样本分布在全国 29 个省(直辖市、自治区),363 个县,1439 个村(居)委会,数据具有全国、省级代表性和副省级城市代表性。目前该数据需要进行申请后才能获得 。
03
老年人口问题调查数据
1.中国健康退休跟踪调查。
中国健康退休跟踪调查(China Health and Retirement Longitudinal Study,CHARLS),由北京大学中国经济研究中心赵耀辉教授组织,旨在收集一套代表中国45岁及以上中老年人家庭和个人的高质量微观数据,以研究我国的人口老龄化、社会保障等问题。CHALRS 全国基线调查于 2011 年开展,覆盖 150 个县级单位,450 个村级单位,约 1 万户家庭中的 1.7 万人。这些样本以后每两年追踪一次,调查结束一年后,数据将对学术界免费公开。目前,数据已经更新到 2015 年。CHARLS 采用多阶段抽样方法,在县/区和村居抽样阶段均采取 PPS 抽样方法。CHARLS首创了电子绘图软件(CHALRS-GIS)技术,用地图法制作村级抽样框。CHARLS 包括个人基本信息,家庭结构和经济支持,健康状况,体格测量,医疗服务利用和医疗保险,工作、退休和养老金、收入、消费、资产,以及社区基本情况等数据。
2.中国营养和健康调查。
中国营养和健康调查(China Health and Nutrition Survey,CHNS),由美国北卡罗莱纳大学教堂山校区的卡罗莱纳人口中心和中国疾病预防和控制中心的营养和食品安全局联合主持展开。调查涉及我国 9 个有代表性的省份,约 4400 个家庭和 20000 个人,包括社区调查、家庭户调查、个人调查、健康调查、营养和体质测验、食品市场调查及健康和计划生育调查。从 1989 年开始,已经完成 9 轮调查,分别是 1989 年、1991 年、1995 年、1997 年、2000 年、2004 年、2006 年、2009 年和2011 年。该数据库完全免费的,并提供中英文两种版本的调查问卷。
3. 中国老人健康长寿影响因素调查。
中国老人健康长寿影响因素调查(Chinese Longitudinal Healthy Longevity Survey,CLHLS),是北京大学中国经济研究中心教授与杜克大学教授及北大老龄健康与家庭研究中心主任曾毅主持的项目。该调查主要为研究老年人问题,如老龄健康的社会、行为、环境与生物学因素,减少老年带病生存期比例,增加老年健康生存期比例,提高老中青生活质量,为科学研究、老龄工作与卫生健康政策信息提供依据。
CLHLS 于 1998 年进行基线调查,随后在2000 年、2002 年、2005 年、2008 年以及 2011 年分别进行了 5 次跟踪调查。CLHLS 基线调查和跟踪调查涵盖我国 23 个省(直辖市、自治区),涵盖省份的总人口在 1998 年是 9.85 亿人,在2010 年是 11.56 亿人,大约占全国总人数的 85%,调查中(不包括海南省)随机选择大约一半的市/县作为调研点进行调查。目前,该数据也可以免费获取。
04
劳动人口问题调查数据
1.全国流动人口动态监测调查数据。
国家卫生计生委自 2009 年开始,每年在全国范围内组织流动人口动态监测调查。该数据包括年度数据、分省年度数据、分地区年度数据和专题数据。主要涉及流动人口生存发展状况、迁移特征、就业收入、居住情况、社会融合、心理健康、基本公共服务、基本医疗服务、基本社会保险、健康状况等内容。
该数据样本量较大,具有很大的代表性。如,2016 年流动人口问卷中,调查地区为我国 31 个省(直辖市、自治区)和新疆生产建设兵团,包括342 个变量,16.9 万个样本。目前,该数据免费提供给政府部门、科研机构、高校等机构进行学术研究、决策参考等,暂不提供给个人。
2.中国劳动力动态调查。
中国劳动力动态调查(China Labor-force Dynamic Survey,CLDS),由中山大学社会科学调查中心组织实施,是全国第一个以劳动力为主题的全国性跟踪调查。该调查采用多阶段、多层次与劳动力规模成比例的概率抽样方法(multistage cluster, stratified,PPS sampling),在我国 29 个省(直辖市、自治区)(除中国港澳台、西藏、海南外)抽取样本家庭,调查对象为样本家庭户中的所有劳动力(15~64 岁的家庭成员),并定期更换样本。2011 年在广东进行了试调查后,2012 年在全国进行了基线调查,每两年进行一次追踪调查,截至目前 2014 年和 2016 年已经进行了两轮追踪调查。目前所有数据对中山大学师生公开。
05
其他
许多高校经常在寒暑假期间,组织学生开展各类社会实践活动,对各地进行调查。样本量一般也较大,具有很大的利用价值。但使用这类数据时,要明确调查地点和抽样方法,借助各种方法,说明调查数据的可信度、可靠性和代表性。
总结
大型微观调查数据库为大多数学者进行学术研究提供了便利,数据样本量大、抽样方法更可靠,并且连续对调查对象进行跟踪调查,形成非常有价值的面板数据。在进行研究时,可以根据研究目的选取数据。但在使用过程中也要对调查样本和调查方法进行分析,需要注意以下几点。一是指标含义和研究范围。二是样本分布,不同调查目的样本偏向不同,某一群体的权重可能有所不同。三是缺失数据的处理等。