书名:科研统计思维与方法:SPSS实战
ISBN:978-7-115-64189-2
本书由人民邮电出版社发行数字版。版权所有,侵权必究。
您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
著 马秀麟
责任编辑 陈灿然
人民邮电出版社出版发行 北京市丰台区成寿寺路11号
邮编 100164 电子邮件 315@ptpress.com.cn
网址 http://www.ptpress.com.cn
读者服务热线:(010)81055410
反盗版热线:(010)81055315
本书以实际案例和具体应用为驱动,以培养科研统计思维为目标,借助SPSS,系统地讲授了差异显著性检验、方差分析、相关性分析、回归分析、聚类分析、主成分分析,以及结构方程模型的概念、原理和具体使用。
全书共8章。第1章系统地讨论了科研统计思维及统计分析的相关概念,并以量化类典型论文为例抛出统计思维的核心问题。第2章介绍了数据的规范化及预处理,重点讲解了基于数据做论证所必需的前置操作。第3章介绍了统计描述及数据加工。第4章讲解了差异显著性检验。第5章介绍了方差分析及其高级应用,阐述了单因素方差分析、多因素方差分析、协方差分析、多因变量方差分析等内容,以及事后检验、均值边际图等高级应用的相关知识。第6章介绍了关联性分析技术和回归分析。第7章讲解了聚类分析技术。第8章介绍了因子分析与降维,主要讨论了探索性因子分析和验证性因子分析(结构方程模型)等方法。
本书可作为量化研究相关专业本科生、研究生,以及大中专院校学生的教学用书,还可作为有志于了解量化研究方法和科研统计思维的科研人员、工程技术人员以及商务人员的参考用书。
计算机科学技术与其他学科最大的不同就是突破了学科范式的限制,渗透到了各个学科,甚至是其前沿,形成了一套有效的思维模式——计算思维。在大数据时代,基于数据统计与分析的方法和策略已成为计算思维的重要组成部分,对研究者科研能力和科研论文写作能力的提升具有重要意义,以统计分析技术为基础的科研统计思维和能力是实现个人发展的重要基石。以统计学的原理为指导,借助统计学的技术,开展各种层次的统计、分析、归纳和挖掘,对研究结论的论证、科研成果的生成日益重要。因此,每一位研究者都应该成为“数据之海”的弄潮儿,具备专业化的数据挖掘和数据分析能力。
然而,笔者发现,在大量的科研项目中,不同程度地存在着统计分析方法被误用或者滥用的问题。笔者作为评委评审学生的科研课题时,每年都会发现多份存在着误用统计分析方法问题的科研报告。错误的研究方法,会导致研究结论缺乏可信度,直接严重影响研究质量。探究学生和研究者在量化研究中出现的各种问题,笔者认为,其原因主要有以下3方面:首先,部分研究者并不清楚每种统计分析方法的约束条件,也不知道该统计分析方法对原始数据有哪些要求。其次,部分研究者并未掌握各统计分析方法的基本原理,不理解为什么要这样解读分析结果。最后,部分研究者对分析结果表格中的各数据项一知半解,只会简单地套用“检验概率”Sig值小于0.05这个界限,而对其他信息一无所知。正是由于存在这些原因,对实验班和对照班学生的后测结果采用配对样本T检验,对低测度的定序数据则实施皮尔逊相关分析,把无效的线性回归模型作为最终研究成果写入研究报告……诸如此类的错误频频出现,也就不奇怪了。
基于上述现象,笔者认为:科研统计思维和能力的培养要抓住两个方面:①力抓针对统计分析方法原理、数据规范和输出结果的解读;②力抓基于统计思维的科研论文写作规范。如果不掌握统计分析的算法原理和基本用法,科研统计思维就无从谈起;而以规范的方式撰写基于量化研究方法的科研论文,则是梳理自己的研究思路、规范自己的研究行为,从而促进科研统计思维和能力快速发展的必由之路。基于此,在本书写作过程中,笔者创新性地引入了科研论文品读这一板块,除第1章之外的每章均以研究报告品读为起点,为大家导入本章所学知识的逻辑框架及相关的写作范式和要素,促使大家在品读研究报告的过程中产生疑问和需求,形成强烈的学习动机。实战案例则能使大家直观体验所学的统计分析算法,并帮助大家应用统计分析方法解决真实的科研问题。
本书得以成稿,得益于多年的教学积累和多方面的支持。2011年春季,笔者开始面向北京师范大学文科拔尖班开设“社会科学统计软件及应用”课程,以培养学生利用统计软件开展科学研究和撰写学位论文的能力。2015年,应北京师范大学研究生院要求,笔者面向全校硕士和博士生开设了校级研究方法课“SPSS数据分析的理论与实践”。2021年,笔者在“中国大学MOOC”平台开设了“SPSS数据分析及量化研究”课程,该课程深受学生欢迎,近两期均有万余人听课,评分近满分;2023年初,应清华大学“学堂在线”邀请,以量化研究能力培养为目的的课程“SPSS数据分析与量化研究”在“学堂在线”平台正式面向全国硕博研究生开课。经过多年的努力和积累,相关课程已经获得了北京师范大学精品课、校级优质课和北京市市级优质课等多项奖励。因此,本书是在多轮精品课程建设和笔者多年学术思考的基础上发展并完善起来的。本书还受新疆师范大学“十四五”重点学科招标项目“生态视角下新疆高等教育高质量发展研究”(项目号:23XJKD0201)支持,为其中期成果之一。另外,人民邮电出版社的李莎老师、陈灿然老师为本书的出版做了大量的工作,并提供了非常全面的支持。在此,特向为本书出版作出贡献和帮助的单位和个人表示诚挚的感谢。
在大家阅读本书过程中,欢迎大家登录“中国大学MOOC”或清华大学“学堂在线”平台,检索由“马秀麟”主讲的“SPSS数据分析与量化研究”课程,并参与线上课程的学习。笔者坚信:通过立体化的线上学习资源和本书的加成,大家一定能实现科研统计思维和实践的同步发展,进而实现个人学术能力的大幅度提升。
本书写作过程中,硕士研究生凡雨、王滕和田淑敏参与了案例整理和验证、文字校对等工作。全书由多强教授最终审定。
尽管笔者尽了很大的努力,尽量避免本书出现各种问题,然而,受诸多因素的制约,仍难免有疏漏或不足之处,恳请各位读者在应用本书的过程中及时地批评指正。有任何意见或建议,可发送至maxl@bnu.edu.cn或chencanran@ptpress.com.cn。
马秀麟
2024年1月于京师园
本书提供PPT、思维导图、案例操作素材、习题操作素材等资源,要获得以上资源,您可以扫描下方二维码,根据指引领取。
尽管作者和编辑尽最大努力来确保书中内容的准确性,但难免会存在疏漏。欢迎您将发现的问题反馈给我们,帮助我们提升图书的质量。
当您发现错误时,请登录异步社区(https://www.epubit.com),按书名搜索,进入本书页面,点击“发表勘误”,输入勘误信息,点击“提交勘误”按钮即可(见下图)。本书的作者和编辑会对您提交的勘误进行审核,确认并接受后,您将获赠异步社区的100积分。积分可用于在异步社区兑换优惠券、样书或奖品。
我们的联系邮箱是chencanran@ptpress.com.cn。
如果您对本书有任何疑问或建议,请您发邮件给我们,并请在邮件标题中注明本书书名,以便我们更高效地做出反馈。
如果您有兴趣出版图书、录制教学视频,或者参与图书翻译、技术审校等工作,可以发邮件给我们。
如果您所在的学校、培训机构或企业,想批量购买本书或异步社区出版的其他图书,也可以发邮件给我们。
如果您在网上发现有针对异步社区出品图书的各种形式的盗版行为,包括对图书全部或部分内容的非授权传播,请您将怀疑有侵权行为的链接发邮件给我们。您的这一举动是对作者权益的保护,也是我们持续为您提供有价值的内容的动力之源。
“异步社区”(www.epubit.com)是由人民邮电出版社创办的IT专业图书社区,于2015年8月上线运营,致力于优质内容的出版和分享,为读者提供高品质的学习内容,为作译者提供专业的出版服务,实现作者与读者在线交流互动,以及传统出版与数字出版的融合发展。
“异步图书”是异步社区策划出版的精品IT图书的品牌,依托于人民邮电出版社在计算机图书领域30余年的发展与积淀。异步图书面向IT行业以及各行业使用IT技术的用户。
本章重点阐述了科研统计思维在大数据时代的必要性。重点内容有:①统计思维及其在大数据时代的价值;②科研活动对统计思维的要求;③量化研究的层次性、存在的误区及其分析;④统计分析的常用软件及其环境。
(1)为什么说当今社会是大数据时代?计算科学对科学研究、人工智能领域产生了哪些影响?为什么说统计思维和计算科学对人类的全体学科均产生了重要影响?
(2)量化研究已经成为社会科学和自然科学的主要研究方法,在具体的科研活动中,科研工作者主要利用了统计学中的哪些技术?为了提升科研质量,应该避开哪些误区?
(3)当今社会中,常用的统计分析软件有哪些?哪些是专业性的,哪些是普通且大众化的?
随着统计分析与数据挖掘技术的日益普及,建立在统计分析和计算科学基础上的研究方法也逐步向诸多学科渗透,已经有越来越多的学者认识到统计科学及其思维模式在基础理论研究、社会发展和人才培养中的价值,于是统计思维的概念与理论应运而生。
案例1:对学生评教有效性的争论
某高校的教职工代表大会(简称“教代会”)会场,代表们吵成了一团,有的代表大声疾呼:“不要再让学生评教伤害教师们的感情了!”“学生评教会毁了学校的教学质量!”原来,学校把年终奖发放与学生评教成绩挂钩,此事引发了强烈的争议:有些教师认为这样做非常好,有利于激发教师的积极性,鼓励教师上好课;而另外一些教师则认为,学生评教成了部分差生攻击报复教师的利器,导致教师不敢管理班级、不敢批评学生。
教代会代表形成了势均力敌的两个阵营,争论愈来愈烈。大会主持人一筹莫展。此时,从事量化研究的刘教授悄悄地靠近大会主持人:思辨与争吵不能解决这一问题!学生评教的质量高低、是否有效必须通过数据的统计分析得出。
于是大会主持人宣布暂时休会,并将聘请大数据专家通过统计分析、数据论证等手段对学生评教数据的有效性及应用情况展开研究,然后在下次教代会上汇报研究结果。
专家对200余万条评教数据展开了效度和信度分析,论证了学生评教数据的有效性,并进一步探究了评价较低的教师存在的问题,为其提供了有效的改进建议。
案例2:这个新药有效吗?
医药服务集团A公司组织专家团队经过多年的研究,研发出一款新型药品,现在要进入人体实验阶段。
根据研究需要,A公司遴选了2000名病情、体重、血压等条件基本相同的病人作为被试,从中随机选出1000名病人服用新型药品,而另外的1000名病人服用安慰剂。服用新型药品的病人为实验组,服用安慰剂的病人为对照组。所有参与本实验的人员均认为自己在服用新型药品。
经过10天实验之后,A公司获得了大量的医学数据。基于这些数据,A公司专家展开了3方面的分析:①针对实验后的数据,利用独立样本T检验分析实验组和对照组的差异是否显著;②分析所有病人在实验前后的状态,利用配对样本T检验分析差异是否显著;③对于完成实验的所有被试,基于其生理指标做聚类和相关性分析,以便把被试分为若干类别,分别实施干预。
研究结果表明:这种新型药品的疗效有限,效果不显著,没有推广的价值。
案例3:专家们的评价可靠、有效吗?
体操和跳水比赛的成绩受裁判员影响非常大,保证裁判员评价的科学性、可靠性和有效性是非常关键的一点,找出评价质量不高的裁判员并予以替换则关系着整个比赛的公平公正。
借助统计分析的策略,对于每轮给分,都首先去掉一个最高分,再去掉一个最低分,删除给分中的极值。针对保留下的得分,只需要做一个基于秩分的差异显著性检验。若运动员的得分之间均具有较高的区分度,则说明裁判员给分具有较高的一致性,即可论证专家评价的有效性。相关内容详见4.2.3节。
案例4:如何平衡不同专家组给出的评价成绩?
高校A是一所著名的985高校,在某年的硕士生面试环节,其C学院的面试工作面临着巨大挑战:因为进入复试的人数过多,所以面试的工作量将会非常大。经办公会讨论决定:组成5个面试小组,每个面试小组负责30名考生的面试。在面试工作结束后,把5个小组上报的面试成绩按照降序排列,依次录取。
然而,有考生质疑:不同小组的专家在给分方面有可能存在偏差,这种偏差将影响考生的排名。换句话说,给分比较宽松的小组中的考生会占便宜。
鉴于这种情况,学院领导做出了“各面试小组须分别对本小组的面试成绩做标准化处理,然后按照公式【T分数=标准分* 20 + 40】重新赋分”的决定,以生成同一标准下的学生得分。
借助统计学中的T分数,A校C学院很好地解决了不同专家组的给分可能不一致的问题。
案例5:以量化分析为主体的科研论文,方法用对了吗?
B高校C学院的刘教授正在评阅学生们所做科研课题的结题报告。在批阅报告的过程中,刘教授时而击节赞赏,时而唉声叹气,时而一副“恨铁不成钢”的郁闷之状。同事小张很是惊讶,问刘教授为何如此。
刘教授回答说:“我在看学生们的结题报告。这几份报告,不论是从选题,还是文献,抑或是论文结构看,都本应该是优秀报告!可偏偏是统计分析方法用错了呀——这份是把实验组与对照组之间的对比做成了配对样本T检验;而这份却对定类变量用了皮尔逊相关分析。我只能给他们‘不及格’了!太可惜了!真是太可惜了!”
在科学研究中,错误的数据处理方法会直接导致研究结论不可靠!这样的论文,在论文评审中会被“一票否决”,因为整篇论文的论证就不成立啦!因此,面向硕士生、博士生开设研究方法类课程,特别是基于数据论证的量化研究类课程势在必行!
上述的5个案例,均是现实生活中会真实发生的事,体现了统计分析方法在现实问题中的应用。这些案例,既有学校管理方面的,也有体育比赛领域的,还有与理工科研究项目密切相关的。从这些案例可以看出,统计思维已经渗透到了人们学习、生活、科学研究的诸多方面。因此掌握一些统计分析方法,培养自己的统计思维,提升自己的统计分析素养,对于当今社会的人才发展是至关重要的。
希望这5个案例,能让各位读者对统计分析方法的作用、统计思维的重要性建立起初步的了解,渐渐掌握甚至爱上统计分析!
管理信息化、教育信息化、企业现代化的快速发展,促使各行各业极快地积累起了大量数据,使人类快速进入“大数据时代”。如何充分地利用这些数据,从中总结出规律,以便为下一步的决策提供依据,或者依据数据分析实现智能化推送,已经成为社会科学的重要研究领域。
分析数据内部所蕴含的规律、预测相关系统的运行趋势,已经成为当代信息处理的主要任务,成为每一个机构、每一个科研项目必须面临的课题。基于这一需求而快速发展起来的数据建模技术、数据挖掘技术已经成长为计算机科学的重要应用领域,也成了管理与决策的重要依据。
因此,大数据时代,每一位研究者都应该成为“数据之海”的弄潮儿,具备专业化的数据挖掘和数据分析能力,这些能力也是个人发展的重要助力。在科学研究活动中,以统计学的原理为指导,借助统计学的技术,开展各种层次的统计、分析、归纳和挖掘,对科研成果的生成、研究结论的论证非常重要。综上所述,科研统计思维培养是大数据时代学科发展的迫切要求。
众所周知,统计分析是理工类专业实验数据处理、结论归纳,获得有价值的研究成果的重要方法。然而,在计算机科学和统计分析软件真正地普及以前,基于大量的调查数据开展统计与分析是一项计算量很大的工作,而且要求研究者精确地了解统计学的基本理论,掌握每个统计分析算法的机理和规范。因此,彼时对量化研究者的要求非常高。在社会科学的研究中,传统的研究以质性研究方法为主。然而,随着专业化统计分析软件的普及,借助统计分析工具开展量化研究已经成为很多文科科研人员的常规研究方法。
不同学科所形成的统计研究方法在计算机科学与技术的支持下实现了快速发展。自然科学的主流研究方法范式——实验数据的量化处理,发展出了一整套形式语言理论、编译理论、检验理论及优化理论。而人文社会科学的主流研究范式——思辨研究、质性分析,也受到了计算机科学和数据处理理论的冲击,从基本文本分析到语义分析、语料分析处理,都能借助计算机将原本只有人工才能进行的复杂分析机器化和程序化,并借助数据处理的理论和方法获得了可信度更高的研究结论——“基于数据做论证”已经成为广受认可的研究方法。
当统计分析方法作为工具和技术所承载的方法论属性渗透进来后,它已经超越了学科疆域的研究规则和框架,而是形成了跨学科的研究范式。也就是说,科研统计思维的理念和模式已对众多学科的研究方法体系产生了重要影响,甚至从根本上改变了其原有的研究范式。
在传统的科研数据处理中,如果想基于数据开展量化研究,则需要以统计学、统计分析的理论为基础,通过大量的数据计算,分析数据之间的相关性、差异性,甚至包括归因分析、聚类分析(降维分析)等,才能获得研究结论。这一过程涉及的规则很多、计算量庞大,对非计算机专业和非统计学专业的多数学者来讲,都存在着很大困难。然而,随着众多统计分析软件的出现,为面向数据的统计与分析提供了很好的工具,特别是SPSS、SAS等软件的出现,极大地促进了科研统计思维的普及与发展。目前,对多数从事人文科学研究的科研人员来讲,SPSS和SAS中的各类统计分析工具就像一个只有“输入”和“输出”的“黑匣子”,在开展量化研究的过程中,不需要了解黑匣子的内部结构,只需要能精确地掌握其输入数据和各项参数,并解读其各类输出结果所代表的具体含义,就能够很好地使用它们。统计分析软件的广泛使用,推动了科研统计思维的普及,使科研统计思维在人才培养中的地位日益提升,科研统计思维的策略在科研、教学中日益重要。
因此,尽管面向非计算机专业和非统计学专业学生直接讨论数据挖掘和统计分析技术的原理和算法会存在困难,但是,如果只是把数据建模和数据挖掘技术的概念、方法和工具以科研统计思维的模式介绍给学生,允许学生在借用数据建模和数据挖掘的现有工具时不必详细掌握其内部的算法结构,只需了解每个工具的输入、输出及其参数规范,让学生逐步具备准确地使用统计分析工具并解读统计分析结果的能力,还是完全可行的。如果做到了这一点,我们的学生在参与普通科研活动时就能借助这些工具开展统计分析并能根据分析结果获得比较准确的量化结论。与此同时,如果学生们熟练掌握了这些工具的用法,也一定能够拓展学生的解题方法,使研究的科学性、严谨性都能得到很大的提升,从而优化其思维方式,促进其科研能力的发展。
统计主要是基于数据做计算并从中探究其内在规律,因此统计也被称为“统计分析”。统计分析的关键技术主要包括统计描述和统计推断两个层次。其中,统计描述是对现有数据只进行统计,并从数据的集中性、离散性和分布形态3个维度做出描述;而统计推断则是统计分析的主要手段,它主要指借助统计分析算法做出推断,即首先给出假设,然后基于数据计算,推断假设是否成立——计算出原假设成立的概率。
在统计分析过程中,人们通常需要了解数据序列中的数据会集中于哪一个数据点周围。该数据点是在统计分布上具有明显集中趋势的数值,代表数据序列的一般水平。常见的描述量主要有均值、中位数和众数等。
在统计中,均值、中位数是针对取值大小有意义的数据序列的集中性描述统计量,常用于身高、体重、长度等测量值;而众数主要用于描述取值大小无意义的数据序列的集中性,诸如民族、生源地等。
在统计分析中,人们通常需要了解数据序列在均值上下的波动程度,即对数据离散性的描述。数据在均值附近的波动性大小是序列的重要属性之一。衡量数据序列离散性的描述统计量主要有方差、标准差和异众比率。
在统计中,对于取值大小有意义的数据序列,人们通常以方差或标准差来描述其离散性;对于取值大小无意义的数据序列,则以异众比率描述其离散程度。异众比率指非众数组的个案在总体内所占的比重。
数据的分布形态对分析方法的选择具有重要影响。因此,在描述数据时,阐明数据的分布形态也非常重要。在统计学中,数据的分布形态主要有正态分布、均匀分布、指数分布、泊松分布等。另外,偏度和峰度也是描述数据分布形态的重要指标。
目前用得最多的统计推断技术主要有关联性分析、差异显著性检验、聚类分析、降维分析、信度和效度检验、主成分分析等多种。
关联性分析是指对两个或多个可能具备相关性的变量进行分析,从而衡量变量之间相关关系的密切程度。相关关系的密切程度可以分为高度一致性(即高度正相关关系)、高度相反性(即高度负相关关系)、不相关。
从关联性分析包含的策略看,关联性分析包含相关性分析和回归分析两个层次。
在统计分析学中,对两个数据序列相关性的分析主要通过相关系数r和相关性检验概率p值两个指标来体现。其中,相关系数r的绝对值在0到1之间,反映两列数据的关联程度;p值则为不相关的概率值。
若变量之间的关联性可以用一个函数式表达出来,那么人们把探索这个函数式的过程称为回归分析,把这个函数式称为回归方程。借助回归方程,一方面能够表达变量间相互影响的关系,另一方面还能用于预测。
随着大数据时代的来临,由于数据之间的关联常常为多维的、双向的,因此针对数据之间的内在逻辑,人们更加关注其关联性,而不是其中的因果关系。
差异显著性检验简称为差异性检验,用于判断两个数据序列是否存在显著的差别。数据序列的差异显著性检验分为均值差异性和分布差异性两种形式。对于具有正态分布形态的两列连续型数据,通常可检验其均值差异性,即通过检查均值之间的差异程度判断其差异是否很显著;而对不明形态或非正态分布的数据,则常常检查其分布差异性。
差异显著性检验是一种推断检验。通常首先假设两列数据之间没有显著差异,通过计算相应的统计量判断无显著差异的可能性(即概率p值)。在统计学中,通常以0.05为界限(即95%的置信度),若两列数据无显著差异的检验概率值p大于0.05,则承认原假设,即两列数据之间没有显著差异;反之,若两列数据无显著差异的检验概率值p小于0.05,则认为它们之间具有显著差异。
在调查或研究过程中,常常需从多个视角制作调查或评价指标,从而能够全面地反映调查对象的属性和特点。然而,调查完成后,研究者经常发现指标项非常多,难以凝练出较为简练的结论,或者因多个指标项的语义存在严重重叠,导致语义关系不清晰,这就需要基于数据进一步凝练指标项,以使研究结论维度更少,语义更清晰。
简而言之,降维就是减少评价指标的维度,进一步凝练指标项的过程,从而使结论变得更加易于表述和理解。
在数据统计与分析过程中,常常需要把成千上万的个案分成若干类,以便于操作。例如,人们把学生分为男生、女生,就是一种分类,还可以把学生按照综合表现分为优等生、良好生、普通生和差生,这也是一种分类。这种仅仅基于单个变量的分类非常简单,一目了然。然而,如果分类依据非常复杂,需要基于多个变量的取值来实施分类,那么其操作就需要专门的算法。
这种依据多个因素变量的取值,对个案分类的过程就是聚类分析,也叫分类分析。所以,聚类分析就是分析收集到的数据,根据其内在规律和特点,把相似的数据归结为一类,从而形成多个类别的过程。
在数据统计分析过程中,聚类分析可以分为针对个案(记录)的分类和针对变量(字段)的分类。针对变量的聚类过程实际上也是一种降维过程。
信度是反映数据可靠性的指标,用于反映数据是否可靠,是不是测量对象的真实反映;而效度是反映测量依据有效性的指标,效度通常由测量工具的有效性来体现。例如,以天平测量物体的质量,天平是有效的测量工具,那么这次测量效度就高。
主成分分析是从描述客观事物的若干变量中抽取其关键信息的统计分析方法,其作用是把描述某一类别客观事物的若干变量用较少的、更简洁的几个潜变量描述出来。
数据统计分析的发展遵循两条思路。其一,面向静态数据的数据分析(Data Anlaysis,DA);其二,面向动态数据的实时数据挖掘(Data Mining,DM)。
所谓面向静态数据的数据分析,是指借助数据分析专业软件,对通过社会调查、科学实验所获得的数据,或者对从信息系统导出的某一时间段的数据进行分析。这种分析很少考虑数据的动态性、过程性和变化性,往往是针对某一时间段的状态所做的数据分析。
所谓面向动态数据的实时数据挖掘,是指在信息系统中集成数据挖掘算法,以便信息系统能够随时针对动态数据开展分析。这种技术强化时间序列特点,依托支持动态数据采集和集成的数据仓技术,开展实时的数据分析。它对用户具有很高的要求,已经成为主流数据库系统的重要功能。
随着“大数据热”愈演愈烈,数据分析与数据挖掘的算法日益成熟,统计学、数据挖掘的技术手段被引入大数据处理过程中,起到了重要的作用。
首先,统计学理论被引入大数据处理领域,统计分析的手段已经变成了数据分析的常规手段。由于大数据的规模比较大,经过数据清洗的有效数据通常符合统计规律,因此信度检验、关联性分析、数据离散性描述(方差、标准差)、聚类分析、主成分分析等被广泛地应用到大数据处理的过程中。目前,这些技术已经被集成到多种计算机信息系统中,发挥着越来越重要的作用。
其次,除了传统的数据分析技术之外,遗传算法、神经网络、语义网络、分布式数据库管理等面向大数据的处理技术也已经日益成熟。
最后,专业的数据挖掘软件、数据推送技术快速发展。应大数据处理的要求,IBM、微软、甲骨文(Oracle)等公司都在自己的大型数据库管理系统(Database Management System,DBMS)中集成了数据挖掘技术,强化时间序列特点、支持数据挖掘技术的数据仓已经成为主流数据库系统的重要组件,为基于大数据的数据挖掘提供了强大的技术支撑。
大数据、并行计算、深度学习是当代人工智能的三大要素。人工智能建立于海量优质数据和应用场景的基础之上,基于海量数据的模型训练是深度学习的核心策略。在这个过程中,算法的质量、训练数据的数量、规模等因素尤为重要,丰富的海量数据集是算法模型训练的前提。大数据一方面为人工智能提供了大量的训练数据,另一方面还为人工智能的发展提供了优质的数据处理算法。在这个过程中,统计分析中常见的判别分析、聚类分析、回归分析等算法是人工智能领域模式识别和模型训练的基石,正是由于统计分析算法和统计思维的存在,人工智能才在近几年取得如此瞩目的成就。
统计分析的常见策略主要包括数据统计描述、数据差异显著性检验、关联性分析、回归分析、聚类分析、降维分析等内容。这些策略可以分为两个不同的类别,其一是对数据的描述与检验,其二是基于数据建模并依据模型对未来数据实施判定或预测。上述策略主要有两种关键思路。
(1)统计推断的基本思路
在数据检验前,先提出一种假设,然后按照特定的算法对假设进行检验,最后根据检验概率判定假设成立的可能性。这就是统计推断。
在实证研究中,人们通常先假设“不显著”,例如,实验班与对照班学生的成绩没有显著差异,或学生性别对物理成绩没有显著的影响,爱好与性别没有关联性。这个假设被称为零假设,简记为H0。然后利用已有的数据进行计算、归纳,最后根据统计规律分析零假设成立的可能性。
例如,在数据的差异显著性检验过程中,人们通常预先假设两列数据不存在显著性差异,然后依据SPSS或Excel内置的算法算出假设成立的概率值(即假设成立的可能性)。若假设成立的概率值p大于5%,则表示原假设是成立的,两列数据之间是不存在显著性差异的;若假设成立的概率值p小于5%,则表示原假设是很难成立的,即两列数据无显著差异的可能性很低,两列数据之间是存在显著差别的。
对两列数据的关联性分析也借助了这一思路。
(2)统计推断中常见的两种错误
在统计推断中,“显著性”是研究者期望得到的结果。例如,经过教学改革,实验班与对照班学生的成绩有显著性差异;在医药领域,服用新药的病人与服用安慰剂的病人身体状况有显著差异;在归因分析中,新媒体技术的应用对学生的物理成绩产生了显著影响……
对于“显著性”的统计推断,容易发生两类错误:其一,错误地拒绝了零假设,把不该显著的事情判定为“显著”。这类错误也被称为第一类错误(即α错误,或TYPE I错误)。其二,错误地接受了“零假设”,把本该显著的事情判定为“不显著”。这类错误也被称为第二类错误(即β错误,或TYPE II错误)。
从科学研究来看,犯第一类错误的危害较大,相当于把“无差异”判定为“有差异”、把“无效”判定为“有效”。这可能会衍生出后续的研究、应用,其危害将是不可估量的。相对而言,犯第二类错误的危害则相对较小,研究者如果对自己的假设很有信心,可能会重新设计实验,再次来过,直到得到正确的结果。
除了样本自身和计算精度的影响之外,在“何种情况下拒绝零假设”的标准对于减少两类错误非常重要。标准定得过宽,则容易犯第一类错误;标准定得过严,则容易犯第二类错误。
因此,在科学研究中,人们通常指定“检验概率值p = 0.05”作为判断是否承认零假设的标准(即常讲的置信度为95%)。当p≥0.05时,就承认零假设,认为研究对象的表现不显著;只有在p < 0.05时,才拒绝零假设,认为被研究对象的表现是显著的。在特定情况下,为了提升研究的标准,进一步控制“显著性”,人们也常常把p = 0.01作为拒绝零假设的标准值(即置信度为99%)。
在统计学中,p = 0.05这个标准被称为“置信度95%的显著性标准”,因此也常被写作Sig值= 0.05。
在统计分析中,不论是做回归分析还是判别分析,其实都是力图创建一个尽可能与测量数据很好地拟合的数据模型——创建并检验模型质量的过程就是建模。对于模型的质量,人们通常利用“模型值/误差值”(即效应值)来判定模型的有效程度,这一思路贯穿了统计分析的各个过程,只是在不同的模块中可能呈现为不同的具体形态。
例如,在两次抽样数据的差异显著性检验中,人们常常使用两个均值的差与其标准误(即SE)的比值来判定两个数据序列是否存在显著性差异。事实上,若两个序列的均值之差远大于标准误SE,则表示这两个序列之间的差距远远大于各个组的组内正常波动,即组间的差异值不是由组内正常波动而引起的,组间的差别应是由分组所导致的。这就是非常重要的T检验的核心思想。对应的公式如式1-1所示。注意,公式中的Xa和Xb分别表示两个序列的均值,SE则代表着抽样数据的标准误。
式1-1
在线性回归分析的处理中,通常需要根据已有的数据创建回归方程,即基于已有数据建构模型。在完成了建模后,根据模型计算出的数值称为回归值(即期望值),而原始数据(观测值)与回归值之间的差被称为残差,也可以称之为误差。回归值越接近对应的观测值越好。因此人们用“回归值的均方和”与“残差均方和”的比值(简称F值)来评价回归方程的质量。这个比值越大,表示回归方程的影响力越大,回归效果越好。在理想情况下,回归方程能够完全拟合测量值,则相应的“残差均方和”为0,导致F值为无穷大。评价线性回归质量的计算方法如式1-2所示。
式1-2
同理,判别分析也借助了与此相似的评价方式,通过残差与有效数据的比值来反映判别效果,这个比值(Wilks Lamda值,即威尔克斯λ值)越小,表示判定效果越有效。
注意:
本节为了阐述统计分析的一些基本思路而提及了较多的术语,对于这些术语,读者可暂时只是记忆,但不做深入理解,后续将进行详细的解读。
基于数据的量化研究已经成为科学研究的主要形式,而统计分析技术的应用是量化研究的主要形式——基于测量和数据展开挖掘与分析,进而获得研究结论。为了保证研究的科学性和严谨性,科研中的量化研究已经形成了一套稳定的模式,统计思维在其中发挥着举足轻重的作用。
以统计思维为基础的量化研究法在自然科学的研究中占据着非常重要的地位,推动自然科学实现了巨大的发展。其中的应用模式主要有以下3种。
物理学、化学、生物学等领域均涉及大量实验,而且很多规律都建立在实验或实践活动的基础上。对实验数据的处理离不开科研统计思维。
在我们学习牛顿第二定律的时候,放在斜坡上的小车在等时间间隔下的位移与时间点均可通过摄像机等手段获取,对这些数据的处理,就是以时间作为自变量、以位移作为因变量的回归分析的过程。类似的例子不胜枚举。
在医药领域,每日均有大量新型药品问世;而在农业领域,则总有众多新肥料、新农药上市。这些新产品的成效如何确定?
针对这一问题,绝对不能依赖单一的个案就做出“有效”或“无效”的结论。研究者通常需要预先选择大量的被试,并将他们随机分配为实验组和对照组成员,通过构建“实验组-对照组”的研究范式,设计出新产品有效性检验的研究方案。
在这种研究方案中,需要预先构建前测无显著差异的实验组和对照组,以保证参与研究活动的被试在实验前的各项指标基本相同。检验实验组前后测状态是否有显著差异,来论证实验组是否有变化。检验后测数据中实验组与对照组是否存在显著差异,来论证新产品的有效性。
这一研究模式在医药领域、农业领域、生物学领域、制造业领域等均被广泛地应用。
在生态学、环境科学等领域,人们通过各种仪器、设备采集了大量的数据,并针对这些数据进行了不同层次的统计分析。比如,针对黄河流域生态环境、水文特征的宏观性描述统计;以某些指标作为因变量,基于某些因素的差异显著性检验,针对黄河流域不同村庄进行的聚类分析等。
正是由于统计分析技术的发展和计算机并行处理能力的提升,近几年面向生态环境、宏观水文规律的大数据研究取得了很多有价值的成果,对于促进国家的宏观发展意义重大。
随着计算机及统计分析软件的普及,量化研究方法逐渐渗透到交叉学科甚至文史哲领域,并取得了不错的应用效果。本节仅从教育学科的视角探讨统计分析在社会科学中的应用模式。
在教育科学中,最常见的一类研究就是以获得研究对象的现状为目的的调查,并在调查数据基础上实现基于统计分析的实证性论证。这类研究以采集能反映某一状态的海量数据为基础,通过对海量数据的统计描述、分类对比,以获取被研究对象的本质属性。
在当前的教育科学中,这类研究占据着重要地位。从已有的研究来看,多数面向状态或现状的量化研究中,数据的来源较为单一,但数据规模较大。比如,山东省近五年新入职青年教师的职业能力调查、河北省农村地区教育信息化发展状况调查及问题分析,都属于这一类型的研究。另外,诸如学生评教有效性的论证、教学改革成效的探索、高考命题的科学性分析、免费师范生整合技术的学科教学知识(Technological Pedagogical Content Knowledge,TPACK)能力发展状况等研究也属于这一领域的研究问题。
在这类研究的具体执行过程中,为了能够获得较客观的研究结论并提升研究结论的学术性,人们通常先借助大样本数据开展整体性分析,然后按照特定的分类依据进行分类跟踪,探索不同类别的样本在目标变量维度是否存在显著性差异,从而提升研究的深度,达到“归因”的目的。
随着教育信息化的普及,很多新技术、新理论被教师主动地应用到教学过程中,产生了类型众多的教学改革项目。然而,教学改革的成效如何?通常需要借助教学实践数据并以统计分析技术来论证。为了达成这一目标,人们常常采用“实验班-对照班”模式组织实证性的教学研究活动。
(1)此类研究的常见流程
首先,选择2~3个具有相同知识基础、在研究问题上具有相同表现的教学班,从中任意选择其一作为实验班(采用新的教学策略),其他班作为对照班(以传统的策略组织教学活动)开展准实验研究。
其次,在实验过程中,通过对比实验班和对照班在研究问题维度上所呈现出的差异性来论证教学改革策略的有效性。
(2)应用模式
其一,前后测、横纵对比的模式。
在开始教学实践前,需采集实验班、对照班的前测数据并进行统计分析,以便论证实验班与对照班在开展教学实践前不存在显著的差异。在结束教学实践后,要采集实验班和对照班的后测数据,检验实验班与对照班的后测数据之间是否存在显著差异。
对于前测无显著差异的两个教学班,若后测数据存在着显著差异,则说明在研究问题所聚焦的点上,新教学策略发生了作用。
在这一模式中,研究者应首先针对后测数据做实验班与对照班之间的差异性对比(横向对比),以论证新策略的有效性;然后再针对实验班和对照班做前后测对比(纵向对比),以论证实验班的成长性。最终,通过差异性是否显著来论证教学改革是否卓有成效。
其二,基于时间序列的模式。
仅有后测数据和前测数据的准实验研究稍显单薄,有时并不足以论证研究结论。为了能够充分地论证研究结论,研究者可在研究过程中组织多轮教学实践活动,并在每轮教学实践末期均采集实验数据,从而形成与时间相关的数据序列。
借助前测数据、研究过程中的多轮实验数据,可以分析教学实验过程中学习者的变化情况,从而更准确地了解新教学策略对学习者所产生的影响,形成更可靠的研究结论。
统计思维在科研过程中主要表现为基于量化的方法探究数据内部隐藏的规律,通过统计描述、推断和建模等手段,努力形成尽可能规范、科学的研究结论。这个过程就是量化研究的过程。
在基于数据的量化研究中,根据统计分析方法和统计分析技术的不同层次,量化研究也可分为不同的层次。
在最初等的量化研究中,为了表示不同类别间的关系,很多研究者对原始数据进行分类,并统计每类数据的个数,在统计出的频数的基础上绘制出饼图、直方图和折线图,利用这些频数、百分比或图像来论证不同类别研究对象所呈现出的特质。
基于频数或百分比论证研究结论,是最简单的统计分析技术,在教育科学的学术研究中虽然仍在大量使用,但其学术性不是很强。
差异显著性检验是教育科学定量研究中的核心内容。在教学管理中,差异显著性检验被广泛地应用。例如,期末考试完成之后,可比较两个教学班学生的考试成绩是否存在显著性差异,班级内男生与女生的成绩是否存在显著差异,不同生源学生的成绩是否有显著差别,学生的期末成绩与期中成绩是否有显著差别。而在教改研究中,人们经常采用“实验班-对照班”模式组织教学活动,以论证教改策略实施的有效性。在此类研究中,实验班与对照班之间前测数据的差异显著性检验、后测数据的差异显著性检验,实验班前后测数据的差异显著性检验,以及针对群体中某一特殊小群体的跟踪和差异显著性检验,这些检验均属常用策略。
利用差异显著性检验,通常能够解决两个方面的问题。其一,直观地论证某一类群体优于或弱于另一类群体。例如,在教改研究中,实验班的后测数据与对照班的后测数据有显著差异,且实验班数据均值高于对照班,能说明新教学策略的有效性。其二,基于差异显著性进行归因。例如,在教改研究中,如果发现“教改前男女生的成绩无显著差异,但经过教改,男生的成绩明显高于女生”,则可以得出结论,新教学策略对男生的影响比较显著,或者说新教学策略与性别相关。
差异显著性检验已是具有相当水平的统计分析技术,在教育科学、医学、社会学、心理学等学科的学术研究中被广泛地应用,并已具备了较好的学术性。
在人文社会科学研究中,出于归因和归纳的需要,人们常常借助回归分析技术,把若干基本因素变量和被解释变量组合起来实施分析,以探索因素变量与被解释变量之间的关系。例如,要分析影响物理课程学习成绩的因素——性别、爱好、认知风格、语文成绩、数学成绩等,就可以使用多元线性回归分析。
在理想的情况下,利用回归分析能够获取表达因素变量与被解释变量之间逻辑关系的回归方程式。利用回归方程式,不但能够发现影响被解释变量的若干因素及其影响力水平,还可以进行预测。
降维和聚类分析则可以通过对变量进行聚类,减少变量的个数,从而降低研究问题的维度,归纳出影响研究结论的关键因素。
回归、降维与聚类分析在人文社会科学的量化研究具有较高的学术地位。在人文社会科学的量化研究中,穿插使用回归、降维和聚类分析,能够实现对研究问题的深层次挖掘,常常能够获得较有价值的研究结论。
结构方程模型是一种建立、估计和检验因果关系模型的方法。模型中既包含可观测的显变量,也可能包含无法直接观测的潜变量。结构方程模型可以替代多重回归、路径分析、因子分析、协方差分析等方法,清晰地分析单项指标对总体的作用和单项指标间的相互关系。
简单而言,与传统的回归分析不同,结构方程模型能同时处理多个因变量,并可比较及评价不同的理论模型。与传统的探索性因子分析不同,在结构方程模型中,可以预先提出一个特定的因子结构,并检验它是否吻合数据。通过结构方程模型多组分析,我们可以了解不同组别内各变量的关系是否保持不变,各因子的均值是否有显著差异。
在教育科学研究中,利用结构方程模型技术,可以针对若干因素变量和多个因变量建立起比较贴合实际的逻辑结构,能够真正地反映教学过程中多个变量之间相互依存、相互影响的逻辑关系。目前,结构方程模型在教育科学的研究中具有很高的学术地位,利用结构方程模型技术,能够有力地提升教育科学研究的学术水准。
在量化研究中,没有来源可靠、信度高的数据,研究结论就无法保障,当然,统计分析方法的正确性和严谨性同样重要,错误的研究方法将导致研究结论被“一票否决”。因此,在社会科学的量化研究中,应该注意避免以下几类问题。
在社会科学的量化研究中,最可怕的现象就是,调查指标或调查问卷不能真正地覆盖研究问题,或者调查指标与研究问题是“两张皮”,二者很不一致,导致研究结论极为不可靠。
2011年前后,笔者曾经评审过这样一个研究课题“从TPACK视角探索免费师范生的技术能力”。研究者主要以调查问卷的方式展开调查,并基于采集到的800多份问卷做了各层次的统计分析,最终获得了研究结论——各专业免费师范生的技术能力由弱到强可排列为:思想政治教育<教育技术<哲学<中文<俄语<历史<生物<化学<物理……然而,这一研究结论却极为可疑!
从其研究结论中可以看出,教育技术专业学生的技术能力仅高于思想政治教育专业,在全校各个专业中位于倒数第二。而从免费师范生参与学校活动的实际情况看,教育技术专业学生的技术能力一直很强,仅弱于计算机专业的学生。因此,此课题的研究结论存在较为严重的问题。
仔细查阅该课题的研究过程,笔者发现调查指标存在着较严重的问题:问卷中绝大多数题目的题干都有很强的主观性,仅关注了研究对象的个人感受,几乎没有一道题目能真正地从技术使用视角测量研究对象对技术的实际应用能力。因此,该研究更像是在探究免费师范生对自己技术能力的满意度,而不是调研学生们对技术的实际应用能力。
总之,在任何一个面向社会科学问题的研究中,调查指标的设计一定要慎重,一定要切实注意“调查指标的结构务必适应研究问题,能够全面地覆盖研究问题”,务必要避免“调查问卷与研究问题‘两张皮’”的现象。
在很多社会科学的研究中,都存在着由研究者自设调查问卷并且一张问卷“包打天下”的错失。而在现实中,导致教育教学发生改变的原因通常是多方面的,而且研究对象在填写调查问卷的过程中还容易受到情感、态度、学习工作状态等诸多方面的影响。因此,在社会科学的定量研究中,要务必注意“孤证难立”,切实注意研究中的风险。
基于上述思路,通常需要在问卷调查的基础上,适当配置访谈、教师评价、学生成绩、学生课堂表现等不同维度的数据,以形成比较完整的评价体系。多视角的数据相互佐证并修正,能减少教研中的孤证现象,以保证科学研究的严谨性和客观性。
统计分析在社会科学量化研究中的地位是毋庸置疑的,不过,初级研究者很容易错误选用统计分析方法,导致研究结论错误。笔者作为评委评审北师大的学生科研项目时,每年都会发现多个基于定量分析的科研项目误用了不恰当的统计分析方法。统计分析方法的错误,直接导致研究结论的可信度不高,会严重影响研究的质量。诸如,对实验班和对照班后测数据之间的差异显著性检验采用了配对样本T检验,对定类变量与定类变量之间的关联性分析使用了皮尔逊相关分析,等等。这些错误导致的问题是非常严重的,轻则使研究结论存疑,重则直接把研究引入歧途。
因此,参与定量研究活动的每一个研究者,都应该精准地掌握每一个统计分析算法,把握其在输入方面的约束条件,并能精准地解读其输出的表格,从而保证能正确地应用统计分析方法,获取可靠、准确、客观的研究结论。
量化研究是基于数据的研究,其核心是数据。在社会科学的量化研究中,应从测量量表的科学性与有效性、测量过程的严谨性、统计分析和结论解读方法的正确性及适时的分类跟踪等几个方面保障研究的有效性。
对研究对象进行测量以获得数据是量化研究的起点。在此过程中,测量依据的科学性和有效性是关系着研究成败的关键因素。
在社会科学的量化研究中,人们通常借助调查问卷或考试试卷对被试实施测量。其中,调查问卷的来源有2类,其一是直接选用已经成形且被学术界认可的调查问卷。由于这类问卷已经被学术界认可,其信度和效度已经得到过论证,它们通常被称为量表。其二是根据研究目标自行设计调查问卷。由于这类调查问卷是由当前研究者根据研究目标自行设计的,在调查指标维度、调查问题设计的严谨性和代表性等方面均有可能存在较严重的问题。因此,为保证这类调查问卷的科学性与有效性,通常需要对这类调查问卷做效度检验。只有效度达到标准和规范,才可使用这类调查问卷开展大范围的测量。
另外,即使是借用权威的量表开展研究,仍要注意量表的适用范围、量表的常模参数,要避免量表的超范围使用和滥用。
在社会科学研究中,基于调查问卷的数据采集经常会受研究对象态度、情感、团体状态等因素的影响。另外,部分研究对象可能会因匆匆填写问卷而未能正确地理解问卷的每个题干,这也会导致测量数据出现较大的偏差。
为保证数据的有效性和客观性,在测量过程中要注意做好以下几点:①测量过程应是有组织、有计划的,整个测量过程应在有限时间内完成;②研究对象应具有代表性,研究对象对当前测量的态度是积极的、欢迎的;③研究者应适当控制测量进度,尽力避免少量研究对象匆匆填写;④对于面向小学生的调查,应向他们仔细解读每一个调查问题,以帮助他们更好地理解题干,避免误解题干导致的数据错误。
量化研究过程中,统计分析是其关键步骤。选用正确的统计分析方法、正确地解读分析结论是量化研究的基本要求。
获得测量数据后,即可根据研究目标选择统计分析类型。在明确了统计分析类型之后,还需根据数据自身的特点确立具体的分析方法。例如,在“实验班-对照班”模式的教改研究中,研究者分别对两个班进行了测量,现在需要检验两个班的后测数据是否存在显著差异,以便论证教改的成效。那么,在配对样本T检验、独立样本T检验、独立样本的非参数检验、方差分析等多种差异显著性分析方法中,到底应该采用哪个分析方法呢?
如果选用了错误的统计分析方法,将导致研究结论被直接否定,整个研究就失去了价值。另外,在完成统计分析之后,要正确地解读分析结论,对分析结果表格中的每一项指标值做出正确的解读。
在量化研究中,多数情况下统计分析结论与研究假设一致,统计分析结论能够论证研究假设。
当然,分析结论与研究假设不一致的现象也并不少见。对于这种现象,研究者无须烦恼,因为这有可能是发现重要创新点的机遇。
在发生此现象之后,研究者应静下心来,对原始数据做分类跟踪,或者依据调查数据的结果值分类并逆推,从中找出问题的根源。在多数情况下,针对统计分析中发现的不正常现象所做的跟踪,通常能够发现亮点(即不为人们注意但非常重要的结论),从而在一定程度上提升研究的深度。
总之,量化研究也需要“跌宕起伏”的情节,请关注量化研究中的异常数据、特殊现象,它们往往是研究亮点的源泉。
信息化时代统计思维的应用离不开统计分析软件。正是统计分析软件的普及,促使统计思维广泛地出现在各类科研活动中。当前,Excel因使用方法简单成为应用范围最广泛的数据处理软件,它在数据预处理和简单统计描述、简单统计推断等领域均有不错的表现。SPSS则是应用最广泛的专业化数据统计分析软件。
科研视点:
在科研活动中,人们经常借助Excel完成数据采集和简单的数据预处理,然后借助SPSS完成专业化的统计分析业务。当然,也有一些初学者直接使用Excel完成自数据采集到专业化统计分析的全部工作。但是,对于各类科技论文,大多数学者更认可基于SPSS的统计分析结果。
大数据时代的统计分析技术可分为两种不同的类型,一种是针对某一时间点的静态数据的数据分析技术,另一种是面向动态变化数据的实时数据挖掘技术。
尽管专业的统计分析工具很多,但在科学研究领域,人们使用较多的统计分析工具仍然是SPSS和Excel。在基于社会调查和评价分析等研究中,人们常常以更为普及的Excel完成数据采集、预处理和简单的统计分析任务,而以专业化的SPSS完成比较复杂的统计分析工作。
(1)SPSS
SPSS是IBM公司推出的一系列用于统计分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称,被广泛地应用于教育、心理、经济、生物、地理、医学等学科领域,是世界上著名的统计分析软件之一。
SPSS软件的全称最初为“Statistical Package for Social Science”,即“社会科学统计软件包”,但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS已于2000年正式将英文全称更改为“Statistical Product and Service Solutions”,即统计产品与服务解决方案,标志着SPSS的战略方向正在做出重大调整。
SPSS for Windows是一个组合式软件包,它集数据录入、整理、分析功能于一身。用户可以根据实际需要和计算机的功能选择模块。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。
(2)SAS
SAS是一款广泛地应用于化学、生物、心理、农医等领域的统计分析软件。SAS的全称为“Statistics Analysis System”,即“统计分析系统”,它最早是由北卡罗来纳州立大学的两位生物统计学研究生编制并研发的,并于1976年正式推出。该系统早期仅提供统计分析功能,目前已发展成为能用于决策支持的大型集成信息系统,当然,统计分析功能至今仍是它的重要组成部分和核心功能。
SAS是由大型机系统发展而来的,其核心操作方式是程序驱动,经过多年的发展,现在已经成为商业分析软件与服务领域的领跑者。
(3)Systat
Systat的全名是“System Statistical”(即“统计系统”),这是一款强大的统计分析软件,它能够为用户提供从基础的描述性统计到基于高端算法的高级统计方法等多种高效功能。
与SPSS等软件相似,它提供了回归分析、变异数分析、表格分析、多变量分析、可靠度分析、时间序列分析、仿真与分配等功能,而且还提供了功能强大的宏语言,以便用户便捷地控制统计过程,开展统计流程代码设计。
除了专业化的统计分析软件外,随着大数据时代的来临,一些办公软件内部也集成了数据分析模块,以供普通用户在自己的工作中完成一些简单的统计分析任务。
在Excel 2010及以后的版本均内置了数据的统计与分析功能,使统计分析成为Excel的基本功能。用Excel实施统计分析的方法有两种:其一是普通的统计分析函数,其二是比较专业的“分析工具库”。
(1)普通的统计分析函数
Excel提供了一组专业的统计函数,帮助人们进行统计分析。常见的函数有:①普通统计函数,如SUM、COUNT、AVERAGE、MAX、MIN等;②条件统计函数,如SUMIF、COUNTIF、AVERAGEIF等;③转码函数,如IF、TEXT、VALUE等;④数据分析函数,如VAR、STDEV、TTEST、FTEST、CORREL等。
(2)Excel的分析工具库
“分析工具库”是Excel的重要组件,它提供了T检验、方差分析、Z检验、F检验等常用的统计分析功能,而且能够提供远比统计函数详细的统计分析结果,有利于用户进行比较专业的统计分析任务。
分析工具库已经成为微软Office系统的默认安装组件。但是,在用户启动Excel时,不会默认加载分析工具库,需要用户在需要使用分析工具库时人工加载。具体加载方法请参阅1.5.2节。
常用的结构方程建模软件包括Mplus、Lisrel、AMOS、EQS、R语言等。其中前面4个是专门的结构方程建模软件,R语言是一种多元化的开源的统计软件,里面有做结构方程的包,但它并不是专门做结构方程的软件。从功能上讲,R的功能最丰富,但其操作难度也最大。
在Mplus、Lisrel、AMOS和EQS等专门做结构方程模型的软件中,Mplus功能最多,操作也比较便捷,并且更新周期短,是当前较为流行也较有潜力的结构方程建模软件。AMOS则具有操作简便、易学,与SPSS配合较好等特色,深受广大初学者的喜爱。
相比较而言,虽然AMOS的功能比其他软件少一些,但其实现结构方程模型的功能仍是比较完整的,而且能够与SPSS无缝连接。因此,笔者推荐大家在学习SPSS的过程中顺便学习一下AMOS的使用。
Excel是数据处理领域中应用最广泛的电子表格软件。随着Excel的普及与发展,Excel不仅被广泛应用于数据计算、变形、检索、简单统计等数据处理领域,它还专门研发了分析工具库等模块,也能胜任统计推断等专业化的统计分析业务。Excel的主工作界面如图1-1所示。
(1)Excel工作表的结构
Excel 2010及其以后的版本采用了“选项卡-功能区”管理模式,其主窗口的顶部是Excel的选项卡和功能区,中部区域则显示了当前工作表Sheet1的内容。
由图1-1可知,中部区域是一个划分了行与列的大型二维表格,顶部的一行用于标记各列的编号,编号以字母表示;最左侧的一列用于标记各行的编号,以数字标记。这个大型的二维表格被称为Excel的工作表,其中包括很多个能够存储信息的单元格,这些单元格用其所在的列号和行号来表示。在Excel 2016中,每张工作表可以包含16 384列,1 048 576行,即共有16 384×1 048 576个单元格。
图1-1 Excel主工作界面
Excel文档被称为工作簿,Excel中的每个工作簿都是一个独立文档,其扩展名为xlsx。每个工作簿都可由多张工作表组成,例如Sheet1、Sheet2、Sheet3等。这一思路与生活中人们所用的记事簿相似,每个记事簿都包含多页纸张,每页纸上都被画上了若干竖线和横线,从而形成了很多行和列。
(2)Excel的单元格及其表示
电子表格中的单元格按照一定的行和列,排列形成一张二维表格,而若干张二维表格叠放在一起,就形成了一个三维结构。
在Excel中,使用字母作为列号,列号依次为A、B、C……Z、AA、AB、AC……AZ、BA、BB、BC……BZ、CA……。行号则使用数字。因此要表示当前工作表中的某个单元格,一定是以字母开头、以数字结尾,例如:AB18表示第AB列第18行的单元格。
如果要表示其他工作表中的单元格,则需要使用三维结构,即在单元格的“列行”标志前加上工作表的名称,而且二者之间以“!”分隔开。例如:Sheet4! AB18表示引用工作表Sheet4中第AB列第18行的单元格。
Excel提供了2种统计分析技术:其一是基于统计分析函数做简单的统计分析;其二是利用其内置的分析工具库开展专业化的统计分析。
(1)以Excel内置的统计分函数做统计分析
Excel中内置了一组函数,用于对数据实施各类分析。常见的统计分析函数如表1-1所示。
表1-1 Excel中常见的统计分析函数
类别 |
功能 |
函数格式 |
---|---|---|
常规统计 |
求和 |
SUM(区域) |
求个数 |
COUNT(区域)/ COUNTA(区域) |
|
求平均 |
AVERAGE(区域) |
|
求最大 |
MAX(区域) |
|
求最小 |
MIN(区域) |
|
条件统计 |
按条件求个数 |
COUNTIF(条件区域,“条件式”) |
按条件求和 |
SUMIF(条件区域,“条件式”,求和区域) |
|
按条件求平均 |
AVERAGEIF(条件区域,“条件式”,求均值区域) |
|
数据描述 |
求方差 |
VAR(区域)/ VARP(区域) |
求标准差 |
STDEV(区域)/ STDEVP(区域) |
|
频度分析 |
FREQUENCY(数据序列区域,分段区域) |
|
数据分析 |
判断方差是否齐性 |
FTEST(序列1区域,序列2区域) |
判断差异显著性 |
TTEST(序列1区域,序列2区域,单侧/双侧,类型) |
|
判断相关性水平 |
CORREL(序列1区域,序列2区域) |
Excel的内置函数很多,表1-1仅仅列出了比较常用的一些函数。对于各个统计分析函数的使用,将在后续章节中逐步讲授。
直接在Excel的空白单元格中输入带有统计分析函数的公式,就能立即在此单元格中计算出统计分析结果。
注意:
利用统计分析函数可以完成简单的统计分析,但由于其输出结果通常为单一的数值(例如,FTEST和TTEST都仅输出其检验概率值,即原假设成立的概率值,并不会同时输出相关统计量的效应值等信息,导致研究者获得的信息比较单薄。),因此,这种分析模式仅适用于非专业化的研究领域。
(2)利用Excel的内置分析工具库做统计分析
① Excel分析工具库的作用和功能
在Excel 2010及以后的版本中,都内置了分析工具库,用于进行比较专业的统计分析。由于基于分析工具库的统计分析不再仅仅输出单一的结果值,还可以输出相关数据列的T值、均值、方差及相关系数等信息,因此,利用分析工具库能够得到更加专业的分析结果。
② 检查分析工具库是否已经启用
尽管Excel内置了分析工具库,但其并不默认处在启用状态。因此,如果想用分析工具库开展统计分析,需要先检查其是否已经启用了。
[1]在Excel菜单栏中单击【数据】选项卡,检查其中是否存在【数据分析】按钮。
[2]若【数据】选项卡中没有【数据分析】按钮,则表示分析工具库尚未被启动;若是存在【数据分析】按钮,则表示分析工具库已被启动,如图1-2所示。
图1-2 【数据分析】按钮
③ 启用分析工具库的方法
[1]选择【文件】→【选项】命令,打开【Excel选项】对话框。
[2]在【Excel选项】对话框的左栏中选择【加载项】命令,在右栏的【加载项】窗口的底部,单击“管理”右侧的下拉按钮,选择【Excel加载项】,并单击【转到】按钮,如图1-3所示。
图1-3 【Excel选项】对话框
[3]在打开的【加载宏】对话框中勾选【分析工具库】复选框,单击【确定】按钮,启用分析工具库,如图1-4所示。
图1-4 启用分析工具库
在分析工具库被启用之后,就能利用【数据】选项卡中的【数据分析】按钮启动Excel的专业化统计分析操作了。
SPSS是专业化的统计分析软件,它与Excel、各类数据库软件均有较好的兼容性,是许多学科科研人员认可的优秀统计分析工具。SPSS提供了数据处理工作界面、基于系统菜单的统计分析、基于语句代码的统计分析3种服务模式。
(1)SPSS的“数据视图”
在启动SPSS并打开数据文件stuInfo.sav(学生信息表)后,会进入如图1-5所示的“数据视图”。
从SPSS的数据视图可知,SPSS的数据集是一个二维表结构。其中,每一行描述一个学生的信息,被称为一条记录,或一个个案;每一列被称为一个数据项,也叫一个字段或者一个变量。
每个个案则表示特定研究对象在各个属性上的取值,比如“张一8”行,就全面描述了学生“张一8”在各个方面的情况。每个变量用于描述全体研究对象在某个属性上的取值,例如性别变量、语文变量等。
图1-5 SPSS的数据视图
在SPSS数据集中,每列的标题(即变量名)独立设置,放置于数据表的顶部,与下方的个案明显不同。这一点与Excel数据表不一样,以这种方式管理数据表,显得更加专业。
(2)SPSS的“变量视图”
单击图1-5左下角的【变量视图】选项卡,则会进入“变量视图”。在SPSS的变量视图中,系统会以列表方式显示出当前数据集内各个变量的类型、宽度等属性,如图1-6所示。
图1-6 SPSS的变量视图
利用变量视图,可以重新定义当前数据集内各个变量的属性,例如重新设置变量名称、数据类型、数据宽度、小数位数及度量类型等属性。
如果数据集已经准备好,初学者可以依据研究问题的要求,借助SPSS的系统菜单【分析】之下的相应子菜单项,直接启动统计分析过程。下面我们来看一个案例。
(1)案例要求
基于数据文件stuInfo.sav中的内容,分析男女生的语文成绩是否存在显著性差异。
(2)案例分析
若想分析男女生的语文成绩是否存在显著性差异,可采用差异显著性检验中的T检验。T检验是检验两组样本差异显著性的检验方法。本例检验男生语文成绩与女生语文成绩的差异性水平,为面向独立样本的差异显著性检验。
(3)基于系统菜单进行数据分析的关键步骤
[1]打开已经准备好的数据集,使之处于“数据视图”状态。
[2]思考研究问题的统计分析要求,即针对两组独立样本的T检验。
[3]选择菜单命令【分析】→【比较均值】→【独立样本T检验】,如图1-7所示。
图1-7 独立样本T检验
[4]弹出“独立样本T检验”对话框,如图1-8所示。此时,需在此对话框中,依据研究目标和数据集的内容,正确选择参与T检验的变量,适当地进行参数配置。
图1-8 “独立样本T检验”对话框
[5]从左侧的变量列表中选中“语文”变量,单击中部的【】按钮,把“语文”变量移动到右侧的“检验变量”列表里,表示“语文”是本案例的检验变量。
[6]从左侧的变量列表中选中“性别”变量,单击中下部的【】按钮,把“性别”变量移动到右侧的“分组变量”列表中,并利用其下的【定义组】功能,设置“性别”的分组为“(‘男’‘女’)”,配置结果如图1-9所示。
图1-9 完成“独立样本T检验”的配置
[7]单击【确定】按钮,启动T检验过程,系统将弹出一个“输出”窗口,如图1-10所示。在这个输出窗口中显示出了T检验的分析计算结果。
图1-10 独立样本T检验的“输出”窗口
(4)解读分析结果
在图1-10所示的“输出”窗口中,首先显示了实现这个T检验的SPSS命令行,然后显示了“组统计”表格,最后显示了“独立样本检验”表格,呈现检验结果。
“独立样本检验”表格中包含方差齐性检验的检验概率值(p = 0.195)、T检验的T值(T = -1.426)和T检验的检验概率值(p = 0.156)。综合这些结果数据,可以得出结论:由于T检验的检验概率值0.156>0.05,我们可以认为“原假设是成立的”,即“男生和女生的语文成绩不存在显著性差异”。
注意:
在通过菜单命令启动统计分析功能后,系统会在“输出”窗口中输出与此分析功能相对应的SPSS命令行。有志于成为SPSS高级用户的读者,可以有意识地研读这些命令行,从而掌握这些SPSS命令。
过去,SPSS要求用户必须以语句代码形式描述自己的统计分析要求。现在,SPSS用户依然可以借助SPSS命令行(语句代码)实现统计分析过程。
[1]打开已经准备好的数据集,使之处于“数据视图”状态。
[2]单击【文件】—【新建】—【语法】命令,可以打开如图1-11所示的“语法”窗口。
图1-11 SPSS的“语法”窗口
[3]在“语法”窗口的右侧主工作区中,直接键入一个SPSS命令语句,例如键入如图1-12所示的语句,表示要根据当前数据集中的数据,做“男女生在语文成绩上是否存在显著性差异的T检验,检验的置信区间为95%”。
[4]输入完语句,单击工具栏中的运行按钮(即【】按钮),启动统计分析过程,如图1-12所示。
图1-12 启动统计分析过程
SPSS提供了两种统计分析方法,它们各有特色,适用于不同的用户。
① 基于系统菜单的统计分析方法:通过菜单启动统计分析过程,以对话框提供人机交互界面,允许用户借助对话框设置详细的配置参数,能够准确、有效、便捷地完成统计分析任务。它适合SPSS的初学者或者对SPSS命令行不熟悉的用户。其唯一缺点是,在需要重复性地处理大量相似的分析任务时,用户需要机械地重复调用系统菜单并配置参数,导致其运行效率不高。
② 基于语句代码的统计分析方法:通过“语法”窗口实现,允许用户直接在其中撰写SPSS命令行实施数据分析操作。运行在“语法”窗口中的命令语句可以被复制,也可以作为语法文件(*.SPS)被保存起来,以供下次使用,因此它具有执行效率高、便于批量处理等优点。但是,这种方法需要用户精准地掌握SPSS的每一个命令行,并能准确地使用SPSS命令语句的参数配置,对用户有很高的要求。
③ 在学习计算机技术时,很多学习者都是先学习界面操作,然后逐步过渡到用计算机语言编程。同样,在SPSS的学习过程中,初学者可以先借助“基于系统菜单的统计分析”完成初步的统计分析任务。如果大家对SPSS命令行操作有兴趣,则可在基于菜单项的操作过程中,通过“输出”窗口逐步熟悉SPSS命令行,了解各种分析工具及其配置参数所对应的SPSS语句。通过一段时间的积累,掌握了一定数量的SPSS语句后,在SPSS的“语法”窗口以编程的方式开展统计分析就不再是难事。
从笔者评审量化研究论文的情况看,多数论文会因规范性、格式而被扣分,研究方法错误导致的后果是“一票否决”。因此,从启发科研思维的视角,笔者决定在此向读者呈现一篇量化研究论文(仅省略部分内容),其目的是借助本文,使大家建立起对量化研究论文的感性认识,并体会量化研究论文写作中统计思维的运用。
论文《大学新生大学生活满意度调查及其影响因素的研究》是一篇比较典型的量化研究论文,力图针对大一新生“入校不适应”的问题展开调查,分析大学新生的生活满意度水平及其中所隐藏的问题,从而为学生工作部门改进工作提供指导性建议。
对于量化研究的入门者,该文存在一定的难度,因为文中出现了很多专业术语、统计分析方法。另外,对其研究结论与统计分析方法之间的内在逻辑,读者也可能会感到迷茫或困惑。这些都是非常正常的。
尽管如此,笔者依旧希望能借本文使大家对量化研究论文的结构、内容建立起感性认知,进而对后续各模块的学习产生期望和激情。因此,现在大家并不需要完全读懂这篇论文,但可以据此对常见的量化研究算法和量化研究论文的结构、写法、行文规范进行基本的了解,明确学习统计分析的具体目标和知识体系。另外,对于在阅读本论文时发现的疑惑或难点,请同学们暂存于脑海之中,少安勿躁,相关知识和技能将在后续的章节中逐一解释并详细说明。现在的疑惑和好奇,将成为大家继续学习的重要驱动力。
最后,衷心希望同学们在未来的学习过程中不断回顾本论文,以验证所学到的统计分析方法并精准解读其输出结果,从而实现基于统计思维的高阶学习,进而形成规范化的量化研究思路,使自身的量化研究能力得到快速发展。
为便于读者更好地理解量化研究论文,笔者以图示方式呈现这篇论文的结构,如图1-13所示。
图1-13 论文的结构
下文节选自论文《大学新生大学生活满意度调查及其影响因素的研究》,请认真阅读,仔细体会文中关于数据采集、数据预处理、质量保证、统计分析技术、写作规范等内容。
大学新生大学生活满意度调查及其影响因素的研究 摘要:每年均有大量新生迈进大学校园,并因不明原因而感到不适应,甚至出现心理问题、学业问题,进而影响其专业能力的发展。本文力图从学习满意度、生活满意度等方面面向大学新生展开调查,探索入学半年之后学生的满意度水平。研究发现,学生的适应性与满意度高度相关,而且受原生家庭、个体心理特征影响较大,新生的师生满意度与其家庭满意度呈正相关。因此,针对适应性较差的大学新生,应从其原生家庭、心理健康等视角施加干预。 关键词:适应性、满意度、影响因素 一、选题缘起(研究背景及问题) (一)研究背景 随着高校的大规模扩招,每年均有数以千万计的高中毕业生进入大学。然而,由于多数新生是首次脱离父母的约束和关爱而独自生活,于是部分新生感觉很不适应,突出表现为时间管理能力不强、学习安排出现纰漏、同学关系恶化等,进而影响了他们的在校满意度。少量学生甚至患上了心理疾病,严重影响了其未来的成长。 从部分严重不适应者的外在表现看,其不适应突出表现在以下3个方面:由于大学教师的教学风格与高中教师有很大不同,一些学生难以跟上大学教师的教学进度,出现学习困难;部分家庭条件较好的学生对学校的住宿条件、集体生活很不适应,导致夜间休息得很差,日间精神状态不好;部分学生不善于与他人沟通,常常独立于班级群体之外,人际关系较差。 (二)研究问题 基于大学新生在大学生活适应性方面表现出的问题,展开面向大学新生的在校满意度调查,探索入学半年后学生的满意度水平,进而探究影响新生在校适应性的影响因素。为此,需要解决以下3个问题。 (1)基于文献调查,探索能够客观表达大学生在校满意度的有效指标,形成大学生在校满意度调查问卷,并论证调查问卷的有效性。 (2)基于调查数据,展开分析,探索当前大学生的在校满意度水平,进而分析学生的适应性水平。 (3)分析与讨论影响大学生在校满意度和适应性的影响因素,并针对主要因素、主要群体提出有效的干预策略。 二、文献综述 (略) 三、研究设计 (一)研究流程 本研究为规范的调查类实证研究,因此应遵循调查类研究的范式,研究的关键步骤如图1所示。 图1 研究的关键步骤 本研究所采用的研究方法主要有问卷调查法、数据论证法。 (二)调查指标设计 基于调查目标,在充分文献调查的基础上,参考马秀麟教授2021年的成果《大学生在校满意度调查指标体系》,本研究确定从4个维度制订本轮调查的调查指标:①被调查对象的人口学信息(性别、所学专业、出生年份、生源地、父母职业、父母最高学历);②被调查对象的学习状态满意度;③被调查对象的生活状态满意度;④被调查对象的人际关系满意度。另外,本研究还关注了被调查对象的总体满意度、家庭状况满意度等信息。 基于上述维度,笔者所在课题组完成了调查问卷设计,共形成了包含42个测量问题的调查问卷。问卷的详细内容可参阅附录。 (三)被调查对象选择及调查组织方式 本调查将面向A校一年级全体新生开展。为保证调查的有效性和被调查对象的代表性,本调查以线上调查的方式组织,并安排在必修课《大学计算机基础》的上机实践课上,在任课教师的统一安排下进行。 由于《大学计算机基础》课程面向全校大一新生集中开设,基于此课程的调查便于管理和控制,学生们的参与积极性也很高,态度端正,有利于保证数据采集的质量。 (四)调查数据质量保证 调查数据的质量保证通常从效度和信度两个视角说明。 1.效度保证[1] [1] 在科研统计中,效度反映调查指标的科学性和有效性。保证效度的常规方法有3种:①参考权威的已有近似量表,在权威量表的基础上修补、建构;②请行业权威专家评审,对调查指标把关;③借助因子分析等技术分析数据中蕴含的维度,检查该维度是否与研究设计(预期调查目标)相符。 效度反映指标的科学性和严谨性,直接决定着调查数据的质量。为保证调查问卷的效度,在正式调查前,笔者邀请3名副教授对笔者设计的调查问卷做了初步评审,并以头脑风暴的方式组织研讨会来论证调查问卷的科学性和有效性。由于这3名副教授均为主研大学生满意度的学者,因此笔者借助专家保证了调查指标体系的效度。 另外,为保证研究的严谨性,笔者还借助SPSS的主成分分析算法对调查数据做了因子分析,结果发现,其KMO = 0.782,巴特利特球形度检验的概率p = 0.000,说明该数据既具有中心性,也不是单一维度的,能够满足主成分分析的要求。主成分分析的结果证实:调查问卷的全体分项问题能够聚焦于3个特征根大于1的主成分,而且各个问题能够很好地吻合相应的主成分,证明此调查指标和调查数据均具备了较高的效度。 2.信度保证 信度反映本轮调查的实施质量,由数据是否真实地反映了被试的状况决定。为保证数据具有较高的信度,笔者在被调查对象选择和调查组织方式方面均做了最大努力,尽量使被调查范围具有较高的覆盖度、被调查对象具有较强的代表性。 调查共回收调查问卷172份,经初步审核,156份调查问卷均数据完整,几乎没有缺失项。为保证调查数据的可靠性,问卷内还设有两个校验性问题,分别指向学生对教师教学的满意度和对宿舍住宿条件的满意度,这两个问题被故意设置为逆向问题,以便借此剔除无效问卷。从采集到的数据看,156份调查问卷均满足校验性问题与被校验问题高度正相关(相关系数r分别为0.971和0.938),而且不存在两者明显相悖的问卷。因此156份问卷均为有效问卷。 对已经采集到的全体数据,经过SPSS 24.0的可靠性分析得到其一致性系数(即克隆巴赫系数)为0.917,说明调查数据的一致性水平很高,具有很好的信度水平。 3.数据的规范化预处理 为便于针对数据进行分析和讨论,先针对变量“性别”“生源”和“父学历”做数值化编码。在数值化编码过程中,要注意依据某一种特定规则编码,以保证新编码为定序变量。同时,为所有变量做“缺失值”标记,以免不规范数据参与统计分析过程。 四、研究结果与讨论 (一)面向数据的统计描述 本研究共发放调查问卷172份,经初步筛选、信度检验和校验项校对,共排除无效问卷16份,剩余有效问卷156份。这156份调查问卷中,有80份是男生填写的,76份是女生填写的,被调查对象在各测量指标方面的统计描述如表1所示。 表1 被调查对象在各测量指标方面的统计描述
从表1的统计结果可知,学生对在校生活的总体满意度还是比较高的,其均值为4.44,标准差为0.603,说明学生们的看法比较一致,离散程度不高。表中集中性取值较低的两个变量是“家庭满意度”和“伙食满意度”,而且具有较高的离散性。从事后针对个别学生的访谈可知:由于新冠疫情防控形势的要求,多数学生高三阶段长期居家,与父母相处的时间增长,部分父母对高考十分焦虑,进而导致学生与父母的矛盾较多,影响了家庭满意度的取值。“伙食满意度”较低的原因是学生来自五湖四海,其口味、饮食习惯有很大的差异,这导致较多的学生对学校食堂的集中供餐评价较低,直接影响了“伙食满意度”的均值和标准差,导致其均值较低而且标准差的取值较大。 另外,被调查对象在生源、父学历分布方面的统计描述如表2、表3所示。 表2 被调查对象在生源分布方面的统计描述
表3 被调查对象在父学历分布方面的统计描述
(二)从人口学视角分析大学生的在校满意度水平 1.不同性别的学生在满意度各维度上存在显著差异吗? 性别是统计研究中非常重要的人口学变量,通常是导致数据变异的重要原因。因此,笔者先检验性别在各个因素上的取值是否会出现显著差异。对有关数据执行独立样本T检验,其结果如表4所示。 表4 不同性别的学生在各个维度上的取值的独立样本T检验
从表4可知,在总体满意度和家庭满意度两个指标上,男女生的看法存在显著差异,而且男生的满意度要高于女生。在具体的评价指标,诸如教学满意度、伙食满意度、人际满意度上,男女生的看法没有显著差异。不过从具体数值上看,在伙食满意度上,男女生的满意度水平呈现为单侧显著性(双侧Sig值= 0.063,单侧Sig值= 0.032);在人际满意度指标,则是女生略好于男生。 2.不同生源的学生在满意度各维度上存在显著差异吗? 生源有可能是影响学生满意度水平的重要指标,因此笔者借助K -独立样本的非参数检验技术,检验了不同生源的学生在满意度的各个维度是否存在显著差异,结果如表5所示。 表5 不同生源的学生在各个维度的取值上的差异显著性检验
从表5可知,从生源视角看,除了人际满意度,学生在其他维度上均存在显著性差异,而且通常是农村生源的学生给分较高,比较容易满足,而大都市生源的学生则给分较低,呈现出较低的满意度水平。在人际满意度维度,处于中档的城镇学生的满意度较高,但未能达到显著性水平。 3.父母学历不同的学生在满意度各维度上存在显著差异吗? 父母学历有可能是影响学生满意度水平的潜在因素,因此笔者借助K -独立样本的非参数检验技术,检验了父母学历不同的学生在满意度的各个维度是否存在显著差异。结果如表6所示。 表6 父母学历不同的学生在各个维度的取值上的差异显著性检验
从表6可知,从父母学历视角看,在满意度的所有维度上,学生们都没有呈现出显著性差异。这说明,从总体上看,学生父母的学历不会成为影响学生满意度的关键因素。但从具体的得分情况看,满意度较高的学生的父母大多数为高学历人员,因此父母学历较高的学生,在满意度的各维度上通常不会打出很低的分数。 (三)探索影响在校大学生满意度的原因 1.诸满意度之间的一致性分析 针对测量变量学校生活、家庭生活、适应否、教师教学、伙食情况、交流满意度做相关性分析,由于部分变量不满足正态分布条件,所以采用“斯皮尔曼相关性分析”,其结果如表7所示。 表7 学生诸满意度之间的一致性分析
**.在0.01级别(双尾),相关性显著。 从表7可知,除了交流满意度指标之外,其他几项满意度之间均呈现为高度正相关关系,即一致性关系。这说明:大学生在校的诸满意度之间存在着相辅相成的关系,而且家庭生活满意度与其他满意度有较高的关联性。因此,影响大学生在校满意度的要素通常不只有一个,而是多个维度共同作用的结果。 2.面向诸指标项的主成分分析 针对调查问卷中的诸测量项,笔者以主成分分析法探索了主指标项的关键成分。在基于主成分分析法的因子分析下,发现全体数据的KMO = 0.723、巴特利特球形度检验概率Sig值= 0.000,完全满足因子分析的要求。经因子分析,获得如表8所示的结果。 表8 面向诸指标项的主成分分析结果成分
从表8可知,从所有变量中抽取出了3个公共因子(即3个主成分),其中“主成分1”上聚集了“教师教学”“多媒体教室”“图书馆”“教材”“校验项”等与教学质量密切相关的变量,“主成分2”上聚集了“网络环境”“住宿条件”和“伙食情况”等变量,它主要呈现出了学生在校期间对生活条件的满意度;“主成分3”则聚集了“朋友数量”“交流满意度”和“师生满意度”等变量,这个维度主要体现了学生在校期间与他人交往的情况。另外,家庭生活满意度指标在“主成分1”和“主成分2”上都有较强的表现,这说明“主成分1”的满意度和“主成分2”的满意度,也与“家庭生活”满意度有很强的关联性。 综上所述,学生在校满意度主要体现在3个方面,依次为“教学质量”“生活质量”“人际交流质量”,同时与高中时期的家庭生活满意度有很大的关联。 3.影响大学生总体满意度的回归分析 对于影响大学生总体满意度的诸个因素及其相互关系,若想探索在其共同作用情况下各因素的重要性程度,则可采用基于“逐步”筛选策略的回归分析。在SPSS中以总体满意度水平作为因变量、各个子指标项作为自变量,做多元线性回归分析,得到如表9和表10所示的回归分析结果。 表9 回归模型及其质量
a. 预测变量:(常量),家庭生活 b. 预测变量:(常量),家庭生活,朋友数量 c. 预测变量:(常量),家庭生活,朋友数量,师生满意度 d. 预测变量:(常量),家庭生活,朋友数量,师生满意度,From 从表9可以看出,在“逐步”模式下,共生成了4个有效回归模型。4个模型ANOVA检验的Sig值均等于0.000,说明4个模型均为有效模型。其中模型4的R方值最大,为0.413。所以笔者选择模型4作为本回归分析的最终模型。 模型4的自变量系数如表10所示。 表10 回归模型的自变量系数
a.因变量:学校生活 从表10可知,真正进入回归模型的变量是家庭生活、朋友数量、师生满意度、生源(即“From”变量),共4个指标。这4个指标对因变量“总体满意度”的影响均达到了显著性水平,是能够影响学生满意度的最关键变量。由此构成回归方程式: 总体满意度= 4.361 + 0.138 *家庭生活满意度- 0.195 *朋友数量+ 0.174 *师生满意度- 0.173 *生源 从回归方程可知,能够直接对总体满意度造成显著影响的变量是家庭生活、朋友数量、师生满意度和学生生源。在回归模型构建过程中,如果改变变量进入模型的条件,降低能够进入模型的变量的F值(修改为2.80),就会发现“伙食情况”和“教师教学”也会进入模型。 综上所述,在影响学生满意度的关键指标中,学生的原生家庭生活、生源地类型、师生关系,是至为关键的变量,然后才是教师教学质量和伙食情况。因此,学生工作部门除了关注教师教学质量、为学生提供较好的伙食之外,更要关注学生家庭、交友情况及师生关系方面是否存在问题。 4.针对全体被试的聚类分析 针对当前数据,笔者尝试进行了聚类分析,以便为不同类别的学生制定具有针对性的干预策略,从而解决部分学生满意度不高的问题。针对当前数据,笔者先进行了“层次聚类”,通过层次聚类生成的冰挂图看到了个案之间的亲疏关系。从层次聚类结果看,被试被分为6个类别比较好。因此,笔者基于“快速聚类”对所有个案按照分为6类的要求实施分类。在完成分类之后,原始数据表的右侧将会新增一列,在该列中以定类变量的形式显示出每个被试被聚合到了哪一类。 快速聚类之后得到的各个类中心如表11所示。 表11 快速聚类之后所得到的类中心
从表11所呈现出的类中心可知,“类别1”的学生属于对教学较为满意,但对校内交流、交往不太满意的学生,对于这类同学,学校应该多组织一些群体性的文体活动,以促进他们广交朋友,加强交流。“类别2”的学生对家庭生活极为不满,对学校的教学质量、生活环境、师生关系均不满意,对这类学生应加强心理疏导,提升他们的自信心和生活信念,通过各类活动促使他们更阳光一些、更有信心一些。“类别3”主要聚集了对学校硬件不满意(多媒体教室、图书馆、伙食情况、住宿条件)且交流满意度低、朋友数量少的学生,对于这部分学生,学校应跟踪其学习、生活的硬件条件,自查是否有能够改进与提高之处,另外,团委、学生会等学生工作部门,要多组织这类学生参加一些群体性文体活动或社团,以提升他们的交流能力,促使他们广交朋友。“类别4”主要聚集了对生活条件不太满意的学生,他们的满意度总体较高。对这部分,学校后勤部门应检查他们的住宿条件和网络环境,以提升其生活满意度。“类别5”中的学生主要是对生活环境和学习环境不太满意的同学,总体来看仍是对学校硬件设施不满,但其不满程度弱于“类别3”。“类别6”是满意度最高的学生,他们除了对伙食情况稍有不满之外,对教学、生活环境、人际关系均表示满意。 另外,从聚类中心来看,全部类别的类中心在“伙食情况”这一维度上的取值都不高,改善伙食质量是全体类别的需求。因此,学校应把改善就餐环境、提高伙食质量、增加伙食品种以适应不同类别学生需求作为学校改革和发展的重要任务来抓。共有4类学生(类别2、类别3、类别4、类别5)对学校的“住宿条件”表现出了较低的“满意度”,针对这4类学生,学校应尽快检查其住宿环境,找到问题的根源,尽力并尽快改善,以提升他们的满意度水平。 (四)讨论与分析 基于A校156名同学的满意度调查,通过严谨的统计分析,获得了若干维度清晰、特色鲜明的结论,既与国内其他学者的研究成果有相似性,又有一定的特色,且对学校改革具有指导意义。 (此处应以统计分析结论,结合文献和同类研究的数据和结论,进行对比、分析和讨论。具体过程略) (五)结论与建议 (略) 五、结束语 (略) 附录:原始数据表的存储结构及含义 |
(1)什么是大数据时代?为什么说统计思维在大数据时代的科研之中非常重要?
(2)什么是计算思维?为什么说计算思维影响了其他学科的发展?
(3)在量化研究中,统计分析技术及应用可以分为哪4个层次?
(4)在量化研究的设计过程中,应该注意哪些问题?要尽量避免哪些问题?
(5)在量化研究中,为保证研究质量,通常需要注意哪些方面?
(6)在统计分析中,常见的统计分析技术有哪些?简述其特点。
(7)在Excel2010/2013中,如何启动分析工具库?
(8)在SPSS中,有哪两种统计分析方法?各有什么特点?
请从“作业素材”文件夹中找到素材文件zysc01.rar,把它解压缩后存储在D盘上,然后完成以下操作。
(1)在Excel2016/2019中,检查“分析工具库”是否被启用?如果没有被启用,请启用分析工具库。
(2)在Excel2016/2019中,启动“数据分析”对话框,观察“数据分析”对话框中主要包括哪些功能。
(3)在SPSS中,打开“作业素材”文件夹内的文档stuInfo.sav,仿照例题的操作步骤,利用基于系统菜单的统计分析方法,分析男生和女生的语文成绩是否存在显著差异。
(4)在SPSS中,练习打开“语法”窗口,并尝试把第(3)题生成的SPSS命令行粘贴在“语法”窗口中,并执行这个命令行,体会用SPSS语句实现统计分析的过程。
(5)在SPSS中,练习保存和打开SPSS语法文件。