超越调查:研究方法的创新 Beyond the Survey: Innovation of Research Method

2020-06-04 16:12:00
admin
原创
摘要:本文作者为上海萌泰数据总经理李军,应中国商业统计学会之约,在全国大学生市场调查与分析大赛十周年之际,给参赛同学分享自己作为大赛评委的体会,以及关于研究方法的认识。


一、前言


应中国商业统计学会之约,在全国大学生市场调查与分析大赛十周年之际,给同学们谈谈自己的作为大赛评委的体会,希望能够给同学们的大赛旅程提供一些指引和帮助。从2015开始,我有幸加入中国商业统计学会,并与大家一起见证了学会和大赛过去五年的成长过程。这五年里,我非常幸运。作为大赛评委,每一次阅读同学们一份份精致的调查报告,每一次欣赏同学们一张张精美的幻灯展示,每一次享受同学们一次次精彩的汇报演讲,我的内心都充满感激和喜悦。


我要感激大家,感激大家利用团队的智慧、辛勤的汗水以及美丽的心灵,去探索和发现我们这个世界和社会上那些影响经济运行的商业逻辑、关系我们和谐发展的社会问题以及涉及当今大学生学习生活的各类现象和规律。每一支参赛团队都是我的眼睛和大脑,你们的报告中将你们的所见所闻、所感所受,所思所想一并毫无保留地呈现出来——数据充分、方法得当、结论准确、建议合理。 这也让我丰富了见闻、拓展了视野、增长了知识。孔子说:“三人行,必有我师焉”,各位参赛的老师和同学们也是我的老师。


除此之外,同学们的现场表现穿着得体、思路敏捷、表达清晰、情感真挚,每一次看到大家热情洋溢的笑容、青春阳光的神情、酣畅淋漓的配合,每一次听到整齐划一的口号、生动有趣的对话、深入浅出的分析,我也仿佛融入到了大家的团队之中,成为大家团队中的一员,与大家一起分享辛勤的汗水和收获的喜悦。


五年来,我很享受这一切美好的回忆,因此也想借此十周年之际,写一点文字表达对中国商业统计学会以及全国大学生市场调查与分析大赛的最美好的祝福。


我要分享的内容是关于研究方法的话题,事实上,这也是我特别想和各位同学交流的话题。在过去五年的担任评委的经历中,我完整阅读了数百篇大家的调查报告,最大的感受就是研究方法的单一和同质化。因此,我特别为本文的标题中加入了一个吸引眼球的关键词——“超越调查”,并特别增加了英文的翻译“Beyond the Survey”。我需要提前声明的是,我的本意并非是否定调查或摒弃调查,也不是要指出调查方法的不足,而是想强调“市场调查与分析大赛”中的调查,不仅是“调查”(Survey),更是“研究”(Research)的意思。本文将带领大家,分别从概念、方法和思维三个角度来重新认识调查


二、超越调查


1.概念的超越:从调查到研究

一提到“市场调查”或“社会调查”,我们常识的第一反应就是“问卷调查”或“统计调查”。究其原因,我想是因为我们的日常生活中经常接触问卷,比如,电话里经常接到商家的满意度调查,微信群和朋友圈有各式各样的学术调查或有奖调查,商场或交通枢纽经常有各类拦截的消费者调查。这些调查,绝大部分都是以问卷形式展开,只不过形式上有些是通过电话,有些是通过网络,有些是通过Pad或者传统的纸质问卷。


然而,从中文概念上来看,调查还有考察、巡查、审查之意,不仅对应于英文的survey,还有investigate之意。学术领域的“调查”是指为了探寻一个问题而开展学术活动,可进一步引申为 “研究”(research)。因此,广义的“调查”可以同等理解为 “研究”,这种情况下,调查和研究可以互通,比如,社会调查方法、社会调查研究方法、社会研究方法在学术语境下是基本一致的,再比如,市场调查和市场研究也是一致的,其英文均对应于market research。由于中文“调查”的多义性,狭义的“调查”,仅指问卷调查、抽样调查或统计调查方法。在学术领域,尤其是涉及方法论讨论时,“调查”和“研究”的概念往往会有区分,“调查”专指一种“调查法”,是“研究”活动的资料收集方式之一。一般来讲,调查强调资料的收集过程,而研究强调整个学术活动的过程。


再看“研究”的概念,中文的“研究”,研”指审查、细磨,“究”是指穷尽、追根求底。英文“research”=“re”+“search”,也就是反反复复寻找的意思。“研究”指人对事物真相、性质、规律等进行的无穷尽的积极探索。简单地说,“研究”就是一个认真的提出问题,并以系统的方法寻找问题答案的过程,是人类认识世界、认识社会、认识自己的途径。


因此,“调查”,或者更准确的说,“研究”,作为人类认识世界的主要方式,不应囿于“问卷”和“抽样”的束缚,而应该从更广阔的方法论视野中寻找从不同角度认识世界的方式。只有当我们在概念上,首先认识到调查和研究的关系,才能在“研究”的工具箱中找到更适合某个问题的研究方法。


2.方法的超越:研究方法的创新

翻看任何一本介绍调查研究方法的书籍,我们都知道,研究方法除了调查法,还有实验法、实地法和文献法。这四种研究方法自300多年前现代意义上的调查诞生以来,就已经被逐步采用。

 

让我们回溯到近现代,来看看最初的调查形式。一般普遍认为现代意义上的社会调查始于始于17世纪下半叶的欧洲的行政调查和社会问题调查,比较有代表性的人物是法国的科尔伯和英国的经济学家威廉·配第。柯尔柏在担任法国财政部长期间,主持了一系列的大规模的社会调查,如1664年-1665年先后开展的法国社会概况调查和法国制造业调查。1672年,威廉·配第在《政治算术》一书中运用了统计数字、图表等一系列统计指标来分析英国社会经济状况,并提出任何社会现象都应用数字、重量和尺度的比较来进行说明。1774年,英国社会改革家霍华德通过对犯人进行访谈的方法,广泛地调查欧洲各国监狱状况,最终说服英国的众议院通过了改善犯人待遇的监狱改革法案。

威廉·配第(William Petty, 1623-1687)


1831年开始,比利时社会统计学家,近代统计学的创始人凯特勒,开始从事有关人口和犯罪问题的统计学研究,通过掌握的统计资料,发现社会犯罪的现象规律,这可以看做是文献研究的一种形式。1840年,德国心理学家韦伯通过实验发现了差别感觉阈限的定律,即韦伯定律,这是最早的社会科学实验研究方法的运用。1855年,法国冶金学教授、社会学家黎普莱 ,以欧洲劳工家庭为基本调查单位,结合问卷和访谈方法开展个案研究,收集家庭的收支、固定资产以及家庭成员的态度和互动,出版了《欧洲劳工》。1879年,德国心理学家、实验心理学之父冯特,在莱比锡大学创立世界上第一个专门研究心理学的实验室。1886年,英国统计学家、社区生活调查的创始人布思,对伦敦居民的贫困问题进行广泛调查,综合使用了访谈法、问卷法和观察法等多种方法,以及地图、图表和统计表等工具和技术。1897年,法国社会学家、社会学理论三大奠基人之一的涂尔干出版了《自杀论》,该书利用广泛收集的自杀统计资料,首次确立了“假设-推测-检验”的研究范式,是社会经验研究的典范,某种意义上也是一种基于文献的统计分析方法。


凯特勒 (Quetelet, 1796-1874)

到了20世纪初,各类社会调查与研究快速发展,如美国的匹茨堡调查、春田调查、密苏里调查、盖洛甫民意测验所的总统选举调查以及各类早期的社会心理学实验等;同时社会调查也在中国扎根,如1928年李景汉先生“定县调查”、燕京大学社会学系的清河调查、1936年费孝通先生的“江村调查”等。这些研究或采用统计资料、或采用问卷,或采用观察,或采用访谈、或采用实验,涉及调查法、实地法、实验法和文献法等多种研究方法。

黎普莱(Le Play, 1806-1882)


当然,“调查法”由于其数据存储的方式通常是以结构化的数值进行存储,不仅可以借助统计学上的各类数学模型进行分析,而且相比实验等其他方法,操作更加便捷。随着20世纪初抽样理论的逐步完善,尤其是20世纪下半叶计算机和互联网技术的发展,“调查法”,主要是问卷调查的形式,从样本的选取、数据的收集到数据的分析都形成了一整套完整的、便捷的、可操作化和的理论、方法、技术和工具,从而被广泛应用于现代社会的各类调查中。目前,社会科学领域的几个主要的学术调查,如中国人民大学的中国综合社会调查(CGSS)、中国社科院的中国社会状况综合调查(CSS)、北京大学的中国家庭追踪调查(CFPS)、中山大学的中国劳动力动态调查(CLDS)等,均采用抽样问卷调查的研究方法。


但不论采用哪种调查研究方法,其核心均涉及到资料的采集和分析方法,换句话说,研究的探索过程必须针对一定的资料展开,研究无法立足于纯粹的想象之上,即使是哲学的思辨也是建立在研究者对前人的理论或经验之上。调查法、实验法、实地法强调主动的收集一手资料,而文献法也被看做是对二手资料的研究。


随着物联网、大数据、人工智能等新一代信息技术的不断发展,资料来源的不断丰富,资料的采集和分析方法朝着更多元化的方向发展。尤其是基于大数据的研究方法,自2012年舍恩伯格的《大数据时代》发表以来,大数据研究在社会科学界引起了广泛的讨论,一度被认为其有可能颠覆传统的社会科学研究方法。在过去几年中,我本人也曾在多个场合,不遗余力地呼吁和提倡采用这种研究方法,并把大数据研究方法与抽样调查、普遍调查并列的一种新型统计调查方法。然而,当我重新回顾调查的历史,重新思考研究的本质,我不得不重新修订我的认识:大数据的研究方法与其说是一种新型研究方法,不如说是一种升级版的文献研究方法。


文献研究,这不仅包括书籍、期刊论文、杂志、报纸、统计年鉴等印刷资料,还包括电视、广播等媒体产生的音视频资料,当然也应包括互联网、移动APP,物联网以及已有信息系统的数据库中所存储的数字资料。就文献资料而言,大量的资料是以非结构化或半结构化数据存在,在资料数量不是很多的情况下,这并不影响开展对资料(尤其是文本资料)的定性分析和解读,探讨这些资料背后蕴藏的价值和文化意义,亦或者通过人工对资料进行编码,开展定量的统计分析;但当资料数量超过一定的规模,达到“海量”的时候,传统的人工内容分析方法将存在很大的困难,这时,大数据的分析技术将派上用场。通过技术手段,我们可以对海量大数据开展各类数据预处理和统计分析工作。比如,通过自然语言处理(NLP)技术,我们可以将文本按词性或者自定义的词典进行分词,执行词频统计;通过分类、聚类、主题模型等机器学习算法,可以对海量文本按主题自动进行分类;通过情感分析可以对文本的情感进行计算;通过图像识别可以对图片进行分类;通过语音识别技术可以对声音资料文字化,再进一步进行文字处理;当然,通过数据挖掘算法还可以帮助找出隐藏在数据之中的特定模式和规律;当下最热的以深度学习为代表的人工智能技术将进一步提升各类文本挖掘算法、图像识别算法、语音识别算法、推荐算法、预测算法的精度和自动化水平。所有这些技术主要用于对已有数据的预处理,预处理之后的数据将更有利于使用传统的定量统计分析方法,如从非结构化的数据中提取出结构化的变量。当然,大数据技术也可以用于定性分析,比如通过词频统计生成的词云图,或者通过自动摘要技术提取文章的核心观点,或者通过机器聚类技术帮助对海量数据进行归类,这些技术完全可以辅助对内容的解读。


因此,技术本身是为研究方法而服务的,大数据的研究虽然取得了一系列的研究发现和成果,但大数据研究方法还无法成为一种独立于调查法、实验法、实地法和文献法的研究方法。就大数据和人工智能算法而言,其基础仍然是数学和统计学,那种担心大数据和人工智能可能颠覆社会科学研究方法的想法,目前看来,是没有必要的。


尽管如此,就研究方法的创新而言,大数据是对传统文献研究方法内涵的延伸,资料收集和分析手段的升级,是互联网、大数据和人工智能时代最有应用前景的研究方法之一。因此,超越调查的第二个层次,我的观点是在市场或社会研究中要敢于使用多种研究方法,尤其是大数据的研究方法。


社会研究的基本方式[备注2]


3.思维的超越:方法论的融合

我想讨论的第三个超越,是关于方法论的层面,为了通俗一点,我冠以“思维”的超越。目前关于经验研究,主要有实证主义和人文主义两种方法论和价值取向。

 

实证主义强调对经验事实的进行客观的分析,由于数字的客观性,因此实证主义常使用定量分析的方法,调查法和实验法是典型的实证主义研究方法;人文主义强调文化和意义的重要性,注重对现象的解释,对理论的思辨,对知识的建构,人文主义常采用定性研究的方法,对定性研究而言,数字仅仅是作为一种分析来源资料,人文主义者常采用实地法和文献法开展研究。

 

当然,就实地法和文献法而言,以结构化方式存在的资料也可以开展定量分析,对于非结构化的文字资料,访谈文本甚至多媒体资料,通过合适的技术处理,也可以转换成结构化的数据,从而便于开展定量分析。

 

我想指出的是,定量和定性的研究取向是就资料的分析方法而言,就资料本身,以及资料的收集方法,两者并没有本质的区别,即便是问卷调查收集的结构化数据,也可以基于研究者的经验以及与其他资料的对比,开展文化和意义的深入解读。当然,由于定性研究对文化和意义的关注,定性研究特别重视资料收集过程中的情境、互动、体验和感受,因此定性研究的资料收集过程往往更依赖于研究者的个人能力和经验,而无法像定量研究的资料收集过程的标准化和可复制性。

 

我还想说明的是,定量分析和定性分析都各有其优势和不足。定量分析完全基于收集的客观数字开展统计分析,虽然能够有助于发现事物的精确的相关关系和因果关系,但也可能会陷入以偏概全、虚假关系、浅尝辄止等陷阱;定性分析虽然能够有助于挖掘事物的文化和意义,开展或宏观、或微观的深入分析和讨论,但同样可能会导致结论主观、适用局限等问题。

 

因此,当我们就一个具体问题开展研究时,我们应该根据我们的研究目标需要,采用最合适的研究方法,我们不应纠结于不同主义之争(实证主义和人文主义),或者是不同方法之争(定量方法和定性方法)。当我们熟悉了所有这些思维的方式(实证思维,人文思维,定量思维,定性思维),我们就能够做到不同方法论的融合。

 

当一个定性研究者具备定量思维时,我们就能够突破定性研究的局限,反之,当一个定量研究者具备定性思维时,我们也能够弥补定量研究的不足。同理,当我们具备大数据思维时,我们就能突破传统的抽样思维,从而强调总体数据的重要,重视对大数据技术的利用。

 

这种思维的突破不是从一个思维变迁到另外一个思维,而是不同思维方式相互之间的借鉴,是方法论的融合。理解不同方法论的差异,优点和不足,可以开展更具包容性的研究。


研究方法论的融合


三.重新认识调查


最后,让我们来一起重新认识“调查”。


调查,起源于近代的行政统计调查,随后被扩大到社会生活领域,在20世纪早期被广泛应用到了民意调查、市场调查和社会调查等领域,随着抽样理论的完善,基于问卷调查的量化研究被更普遍的使用,而随着互联网、物联网、大数据、人工智能等新一代信息技术的发展,在研究资料收集和分析过程中,计算机技术将发挥越来越重要的作用。

调查,有四种主要研究方法,涉及实证主义和人文主义两种方法论以及定量和定性两种研究取向。针对不同的研究问题,我们可以融合两种方法论,采用多种研究方法和多种资料收集和分析技术,开展定量分析或定性分析,从不同的角度做出更全面、更科学的研究。


“调查”就是“研究”,是人类认识世界、认识社会、认识自己的探索过程,是人类自我成长的助推器,是个人突破自我的催化剂。因此,从这个意义上讲,“全国大学生市场调查与分析大赛”对了解我国经济社会现状,促进社会健康和谐发展,帮助大学生提升自我具有重要的作用。在此,也提前祝第十届“全国大学生市场调查与分析大赛”成功举办,祝各位参赛老师和同学取得优异的成绩。


需要特别说明的是,由于我在理论和实践方面的欠缺,我的一些观点,还存在一些不足,也一定有可以改进和完善的空间,欢迎大家批评指正,我将不胜感激。


备注:

【1】本文作者李军为南京大学社会学在读博士,中国商业统计学会理事,江苏省统计行业协会理事,紫金传媒智库特约研究员,上海萌泰数据科技股份有限公司总经理。萌泰数据是国内知名的社会科学专题数据库和科研教学工具厂商,统计调查研究工具厂商,业界领先的智能化数据采集与分析服务供应商,面向教育科研、统计调查、社会治理、舆情分析、市场研究等领域提供一体化数据解决方案。


【2】本图原创在风笑天老师的《社会研究方法》一书中,笔者仅在文献法中补充了当下流行的大数据分析子类型,以及循证研究的系统评价分析子类型(可对应于风老师书中的二次分析子类型,系统评价可以采用荟萃分析技术进行量化研究,也可以进行定性的比较研究);笔者不是为了指出风老师的书中的不足,相反,笔者恰恰认为风老师的分类方式即使在大数据时代依然成立,只不过资料的存储形式或收集方式有了升级而已。大数据的文本分析也可以认为是一种内容分析,海量的结构化数据的挖掘也可以看做是对统计资料分析的升级。笔者将大数据分析单独列出,是因为其对大数据等计算机技术的依赖,这与传统的文献分析技术有了较大的变化。另外一个补充是将结构化观察也纳入实地研究的一种资料收集方式,比如在商场超市观察以测量人流量,因此实地研究也可以开展定量分析。


——————————————————————————————————————————————————————

萌泰数据是社会科学领域知名数据服务商和科研教学工具厂商,面向社会科学教育实践、学术研究和社会服务,提供一体化数据解决方案。目前旗下包括“锐研”和“智社”两大子品牌。


“锐研”是萌泰数据旗下社会科学专题数据库及科研服务平台,旨在为学者和科研人员提供专题数据库和科研数据采集与分析服务,以及各类社会调查研究方法工具支持。旗下产品包括五大特色数据库、三大指数产品、六大社会调查研究工具以及智慧蜂众包任务平台等科研服务产品。

锐研产品矩阵


萌泰官网:www.monetware.com

锐研中国:www.ringdata.org

锐研专题数据平台:www.ringdata.com

锐研中国官方微信公众号

智社官方微信公众号

Campbell中国联盟官方微信公众号

    发表评论
    评论通过审核后显示。