时间:2023-07-13 17:23:39
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇统计学参数概念,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
大学数学教学大纲
课程代码318.009.1编写时间
课程名称数理统计
英文名称Statistics
学分数3周学时3+1
任课教师*徐先进开课院系**数学学院
预修课程
课程性质:
本课程为数学学院本科生开设,是概率论基础的继续,介绍数理统计学的基础知识。
基本要求和教学目的:
课程基本内容简介:
数理统计是一门理论研究与数学实践相结合的学科,它区别于概率论基础部分,不从概率空间出发,而是考虑如何给随机现象装配一个概率空间。
数理统计学研究数据资料的收集、整理、分析和推断,广泛地应用于社会科学、工程技术和自然科学中。
教学方式:
教材和教学参考资料:
作者教材名称出版社出版年月
教材概率论,第二册,数理统计(两分册)人民教育出版社1979
参考资料陈希孺数理统计引论科学出版社1981
峁诗松,王静龙,濮晓龙高等数理统计高等教育出版社,施普林格出版社1998,2003
J.O.BergerStatisticaldecisiontheoryandBayesionanalysis,2ndedition
中译本:贾乃光译,统计决策理论和贝叶斯分析Springer-Verlag,NewYork
中国统计出版社1985
1988
教学内容安排:
第一章引论
本章的教学目的是阐述数理统计学的基本问题,介绍数理统计学的基本概念。指出了现阶段的教学内容是研究如何利用一定的资料对所关心的问题作出尽可能精确可靠的结论,而不是考虑如何设计获得数据的试验。
统计量是从数据中提取信息的工具。本章介绍了两种常用求估计量的方法,介绍了刻画统计量性能的一致最小方差的概念。
§1统计学的基本问题
§2数理统计学的基本概念
§3求估计量的两种常用方法
§4一致最小方差无偏估计
第二章抽样分布
本章假定待研究的母体服从最常见的正态分布,导出了常用统计量,,的分布。本章的结论是对小样本讨论的,由于正态分布的特殊性,它们也可作为大样本情形的极限分布。
本章还介绍了与正态母体相联系的柯赫伦定理与费歇定理。
§1正态母体子样的线性函数的分布
§2分布
§3分布和分布
§4正态母体子样均值和方差的分布
第三章假设检验(I)
本章的教学目的是让学生认识到参数估计、假设检验和区间估计是针对问题的不同性质而作的三种统计推断,掌握并正确理解显著性检验问题的处理步骤。在本章的执行过程中,给出了一些典型的假设检验问题的分析和理解,以帮助学生掌握和运用这一统计思想。
本章介绍了具有一般意义的广义似然比检验。
§1引言
§2正态母体参数的检验
§3正态母体参数的置信区间
§4多项分布的检验
§5广义似然比检验
第四章线性统计推断
本章主要讨论数理统计学中两类重要的问题,线性模型和回归分析,介绍了处理另一类问题的方差分析。在数学过程中,解释了在复杂问题中使用线性模型的合理性,也分析了统计假设在实际问题中的意义。
在本章的执行过程中,比较了回归分析与线性模型的异同点。
§1最小二乘法
§2回归分析
§3方差分析
第五章点估计
本章从理论的角度讨论了一致最小方差无偏估计的性质。介绍了一些寻找一致最小方差无偏估计的方法。
§1最小方差无偏估计
自从Paelinck提出“空间经济计量学”这个术语,Cliff和Ord(1973,1981)对空间自回归模型的开拓性工作,发展出广泛的模型、参数估计和检验技术,使得经济计量学建模中综合空间因素变得更加有效。
Anselin(1988)对空间经济计量学进行了系统的研究,它以及Cliff和Ord(1973,1981)这三本著作至今仍被广泛引用。Anselin对空间经济计量学的定义是:“在区域科学模型的统计分析中,研究由空间引起的各种特性的一系列方法。”Anselin所提到的区域科学模型,指明确将区域、位置及空间交互影响综合在模型中,并且它们的估计及确定也是基于参照地理的(即:截面的或时-空的)数据,数据可能来自于空间上的点,也可能是来自于某个区域,前者对应于经纬坐标,后者对应于区域之间的相对位置。
国外近几年空间经济计量学得以迅速发展,如Anselin和Florax(1995)指出的,主要得益于以下几点:
(1)人们对于空间及空间交互影响的作用的重新认识。对空间的重新关注并不局限于经济学,在其它社会科学中也得以反映。
(2)与地理对应的社会经济大型数据库的逐步实用性。在美国以及欧洲,官方统计部门提供的以区域和地区为统计单元的大型数据库很容易得到,并且价格低廉。这些数据可以进行空前数量的截面或时空观测分析,这时,空间(或时空)自相关可能成为标准而非一种特殊情况。
(3)地理信息系统(GIS)和空间数据分析软件,以高效和低成本的计算技术处理空间观测的发展。GIS的使用,允许地理数据的有效存储、快速恢复及交互可视化,为空间分析技术的艺术化提供了巨大的机会。至少目前线性模型中,缺少针对空间数据和空间经济计量学的软件的情况已经大为改观。目前已有一些专门的空间统计分析软件,并且SAS、S-PLUS等著名统计软件中,都已经包括用于空间统计分析的模块。
(二)空间经济计量学与相关学科的关系
空间统计学是研究空间问题的另一门学科,它是应用数学的一个快速发展的分支。它起源于20世纪50年代早期,用以帮助采矿业进行矿藏量的计算。最早的工作是采矿工程师D.G.Krige和统计学家H.S.Sichel在南非进行的。70年代随着计算机的普及以及运算速度的大幅提高,空间统计分析技术逐渐扩展到地球科学的其它领域。目前已经普遍存在于需要处理时间上或空间上相关的数据的科技领域中。
空间经济计量学与空间统计学的区分不太容易。Haining和Anselin的观点认为空间统计学的研究大多由数据驱动,而空间经济计量学由模型驱动,即从特定的理论或模型出发,重点放在问题的估计、解释和检验上。空间统计学的主流是研究生态学和地质学中的物质现象,空间经济计量学主要研究与区域及城市经济有关的模型。有一种观点认为二者的区分应基于作者将其工作对应于空间经济计量学还是空间统计学,这种区分办法可能较为简单。
地质统计学(Geostatistics)发展于20世纪60年代,主要用于研究地质学现象的空间结构和进行空间估值。例如,在探矿过程中,通常是在空间上布点进行钻探,然后对采样得到的样品进行分析,估计矿藏的分布和储量。由于矿藏不开采的话,在时间上结构几乎是不变的,因此地质统计学研究的问题主要是空间相关。空间经济计量学所研究的问题不仅存在空间相关,往往所研究的问题在时间上也存在相关。
在区域经济学的理论中,人们建立了各种理论以及关系式来描述人类在空间上的行为,如研究城镇问题的“引力模型”等。但在利用模型进行定量研究问题的时候,需要将理论或关系式用数学模型来进行刻划,利用统计方法对模型进行估计、检验,并进行评价,这些正好是属于经济计量学研究的范畴。应该说,空间经济计量学主要研究区域经济问题,依据的是区域经济学理论,但它还需要综合数学,以及空间统计学等学科,因此它不等同于区域经济学,而是一门交叉学科。
二、研究的问题
空间经济计量学主要研究存在空间效应的问题。空间效应主要包括空间相关和空间差异性。在研究中涉及空间相邻、空间相邻矩阵等概念。
(一)空间相关
空间相关指在样本观测中,位于位置i的观测与其它j≠i的观测有关,即
附图
存在空间相关的原因有两方面:相邻空间单元存在测量误差,空间交互影响的存在。测量误差是由于调查过程中,数据的采集与空间中的单位有关,如数据是按省、市、县等统计的,但设定的空间单位与研究问题不一致,存在测量误差。
空间相关不仅意味着空间上的观测缺乏独立性,并且意味着潜在于这种空间相关中的空间结构,也就是说空间相关的强度及模式由绝对位置和相对位置(布局,距离)决定。
对于空间相关,空间自回归通常是其核心内容,空间自回归模型的一般形式为:
附图
在这个模型中,β解释变量X(n×k矩阵)的参数向量(k×1),ρ是空间滞后相关变量的参数,λ是残差空间自回归(空间AR)结构中的参数。
W[,1]和W[,2]为n×n矩阵,是标准化或未标准化的空间加权矩阵,分别对应于因变量以及扰动项中的空间自回归过程,这两个矩阵可以不同,这意味着两个过程由不同的空间结构生成。
这个模型可以退化成为普通的线性回归模型、(纯)空间自回归模型、混合回归与空间自回归模型、残差空间自回归模型等形式。
对这个模型,普通最小二乘估计不仅是有偏的,而且是不一致的,参数的估计通常采用极大似然估计,近几年,有学者尝试采用贝叶斯估计对参数进行估计。
(二)空间差异性
空间差异性指空间上的区域缺乏均一性,如存在中心区和郊区、先进和后进地区等。例如,我国沿海地区和中西部地区经济存在较大差别。
对于空间差异性,只要将空间单元的特性考虑进去,大多可以用经典经济计量学方法解决。但当空间差异性与空间相关共同存在时,经典经济计量学方法不再适用,而且这时问题可能变得非常复杂,因为这时要区分空间差异性与空间相关可能非常困难。
研究空间差异性的模型主要有:
E.Casetti提出的空间扩展模型(1972)和回归参数漂移分析方法(简称DARP)模型(1982)。这时,空间差异性表现为模型参数随空间位置变化,并以空间单元的位置信息作为辅助变量(称为扩展参数)。
y=Xβ+ε
附图
模型(3)为以经纬坐标(Z[,x],Z[,y])作为扩展参数的空间扩展模型。同样可以以到中心区域的距离作为扩展参数设计模型。
将模型(3)的第二个式子右边加入随机扰动项,则为DARP模型。E.Casetti(1992)进一步提出了贝叶斯空间扩展模型。
D.P.McMillen和J.F.McDonald(1997),C.Brunsdon,A.S.Fotheringham;Martin Charlton(1996),提出地理加权回归模型(简称GWR模型)。
附图
(三)时空数据空间模型
在模型中考虑时间维增加了描述的复杂性,但综合时间空间的模型在实际工作中非常有用。在经典的经济计量学模型中,这是综合截面和时间序列数据的情形。如果数据不存在空间相关,则可以采用Panel Data模型。Anselin(1988)将似不相关(SUR)模型扩展到空间的情形,提出空间SUR模型。
三、应用前景及需要进一步研究的问题
(一)在中国的应用前景
在我国,地质统计学是较早应用空间统计学的领域,在20世纪80年代中国科学院就有人研究并应用Krige模型。空间统计学除了在地质学的研究中发挥作用,近十年来,周国法、徐汝梅等学者研究生态学中的空间相互作用,并于1998年出版了《生物地理统计学》。20世纪80年代以来,我国利用卫星遥感技术,对土地、森林、农业、矿产、能源、作物估产、灾患检测等进行应用,开始了我国空间统计学在经济领域应用中统计调查的工作,为了将空间遥感调查技术逐步纳入到我国统计的常规性工作中,1998年10月,国家统计局成立了空间统计研究室,并与中国科学院地理所合作,组成了“空间信息多重采样设计的空间统计学应用研究”课题组,运用遥感技术和空间分析对我国农业耕地、森林、草地等资源以及城镇动态变化进行调查,该项目获得国家统计局2000年课题研究一等奖。
在我国地质统计学、生物地理统计学及利用遥感技术进行的各种调查,都属于空间统计学的范畴。地质统计学、生物地理统计学主要研究空间相关及空间估值,在生物地理统计学的研究中还包括物种的空间扩散过程。所用的方法主要是各种Krige模型、方差图模型,以及空间自回归模型。空间动态采样的研究,与地质矿产调查类似,主要涉及样本在空间上的布局、有效样本量的确定、采样误差的计算等问题的研究,根据其研究的问题和方法,也可以将其归入统计学的抽样调查分支之中。
随着我国按地区进行统计的统计基础资料不断积累,尤其是遥感技术应用到统计调查中来,都将使得按时间和空间排列的数据资料极为丰富,对数据进行空间甚至时空分析成为可能,人们将逐渐从时间的角度转向普遍从时空的角度来考虑问题。
从经济分析的角度看,空间经济计量学在我国以下几个方面将有很大的应用前景。
由于区域之间存在相关性,或者存在差异性,因此一项政策对每个区域的影响是不同的,通过运用空间经济计量学方法对各区域进行研究之后,找到政策在各区域上作用的关系,对于政府决策、正确制订政策具有很大的参考价值。
由于区域之间存在先进地区和后进地区,通过空间经济计量学方法可以对先进地区与后进地区之间的相互关系进行研究。
按区域编制投入产出表时,空间的概念将发挥作用。
对房地产的价值进行评估时,在考虑外界影响因素的基础上,充分考虑地区之间的相互关系,将对正确评估房地产的价值有很大帮助。
对环境污染进行研究时,运用空间经济计量学方法对污染的传播方式进行研究,有助于人们对环境污染进行控制。
在交通领域的研究,可以利用空间经济计量学方法对人员、货物在空间上的流动方式进行研究,同时对通道上的不同区段进行研究。
在对某种疾病(如流感)在空间上的传播过程进行研究之后,对于疾病的预防控制将有很大的帮助。
建立了空间的概念之后,人们对于在空间上的抽样将综合考虑空间单元之间的相关性。而空间抽样在空间上的布点方式也可以用作商业网点的布局研究。
总之,只要问题涉及到空间的概念,空间经济计量学就将发挥其作用。对空间经济计量学的深入研究及应用,将促使人们面对问题的时候,从空间或时空的角度思考问题。
(二)需要进一步研究的问题
目前的研究中,系统内的空间单元受到系统内其它位置单元的影响,但边界处的单元还受到系统外与之相邻的单元的影响,如何将这个影响考虑在模型中值得研究。
在具体问题中,距离的概念需要加以认真对待,单用地理上的距离有时并不合适,例如国与国之间的经济联系在今天并不是距离远近决定的,电子化交易使得资金的流动非常迅速方便,因此,在研究这类问题时,如何将贸易、人员、资金的流动充分考虑到空间加权矩阵中去,尚值得研究。
贝叶斯方法在统计学各个分支的应用越来越广,空间贝叶斯模型也是目前空间经济计量学研究的热点之一。
可变单元的问题。当数据汇总的级别变化,可能整个模型的描述都发生变化,对于不同的问题,可能影响模型变化的汇总的级别也不同,能否有一个统一的模式对系统进行描述尚待进一步研究。
时空数据的综合分析,参数估计的渐近性质,模型的各种检验方法等,还有待进一步的研究。
经济问题中,许多需要研究的对象是多维的,即研究对象是一个向量,如何在空间问题中建立一系列空间VAR模型,尚需研究。
不易获得较为详细且价格低廉的区域统计数据,将大大限制空间经济计量学模型的应用。建立我国区域统计数据库,要求价格低廉且方便实用,是摆在统计工作者面前的一个重要课题。
【责任编辑】彭非
【参考文献】
1 Anselin,L.1988.Spatial Econometrics.Methods and Models,Dordrecht Kluwer Academic
Publishers.
2 Anselin,L.and R.J.G.M.Florax ed.1995.New Directions inSpatial Econometrics,Springer-Verlag.
3 Brundson,C.,A.S.Fotheringham,and M.E.Chalton.1996."Geographically Weighted
Regression:A Method for ExploringSpatial Nonstationarity,"Geographical Analysis,
Vol.28,p281-298.
4 Brunsdon,C.,A.S.Fotheringham,and M.E.Chalton.1999."SomeNotes on Parametric
Significance Tests for GeographicallyWeighted Regression,"Journal of Regional
Science,Vol.39,No.3,p497-524.
5 Casetti,E.1972."Generating Models by Expansion Method:Applications to Geographic
Research,"Geographical Analysis,Vol.4,p81-91.
6 Casetti,E.1982."Drift Analysis of Regression Parameters:An Application to the
Investigation of Fertility ofFertility Development Relations,"Modeling and Simulation
13,p961-966.
7 Casetti,E.1992."Bayesian Regression and the ExpansionMetod,"Geographical
Analysis,Vol.24,p58-74.
8 Cliff,A.D.and J.K.Ord.1981.Spatial Processes:Models andApplications,Pion.
9 Haining,R.P.Spatial Data Analysis in the Social andEnvironmental Science,Cambridge
University Press.1990.
10 Paelinck,Jean H.P.and Leo H.Klaassen.1979.SpatialEconometrics,Saxon House,
Teakfield Ltd.
11 庄大方,张稳,罗建国.土地资源遥感调查中的空间信息多重采样框架设计与GIS实现,统计研究,1999年第1期.
1.医学统计学标准化试题库建立的必要性
近年来选修医学统计学的学生逐渐增多,考试的客观性、公正性显得尤为重要。当前,不同的学校采取的考试方式不尽相同:有的学校建立了“整卷库”,以整套试卷为单位进行存储,考试时随机抽取一套试卷对考生施测,这种方式固化了试卷结构,不能根据实际需求灵活调整;有的学校简单地将试题按章节存放在一起,试题未经测试与合理的分析,未按能力层次及学科要求进行划分,考试时按章节选出一部分试题组卷,费时又费力;还有的学校指定每位代课老师出一定数量的题目,最后把所有老师提交的题目汇总、组合成卷,由于代课老师往往根据课堂上强调的授课重点出题,因此不能全面考察学生的真实水平。可见,医学统计学考试制度存在诸多问题,要想通过考试客观、准确地评价每个考生的真实能力,充分发挥考试对教学的反馈作用,实现科学化、标准化、规范化、公正化的考试,建立高质量的医学统计学标准化试题库〔1〕势在必行。所谓试题库〔2〕(itembank),并不是试题的简单堆集,而是以一定的教育测量理论为基础,通过相应的数学模型对试题进行多项性能指标分析后,选出符合要求的优秀题目,按次序集中储存的一种形式,并能按要求调出所需试题,最终按规定的条件组合成卷〔3-5〕。医学统计学标准化试题库以合格、优秀的试题为基本单位,能克服现有考试制度的弊端。因此,建议建立医学统计学标准化试题库。
2.理论依据———项目反应理论(itemresponsetheory,IRT)
建设医学统计学标准化试题库的中心环节就是命题、选题。选题时必须根据一定的评价指标对试题进行评估,优秀的、符合要求的试题方可进入试题库。教育测量是以一定的理论为基础,目前用于试题评价的理论主要有经典测量理论(classicaltesttheory,CTT)和项目反应理论(itemresponsetheory,IRT)〔6,7〕。CTT存在很多无法克服的技术问题,如具有试题依赖性和样本依赖性、被试的能力分数与试题难度未建立在同一量尺上、忽略了每位被试的反应组型等等〔8-11〕。于是,近代在CTT基础上发展起来了一种新的测量理论,即IRT,又称潜在特质理论(latenttraittheory)或项目特征曲线理论〔12〕(itemcharacteristiccurvetheory)。IRT以几项基本假设(如单维性假设、局部独立性假设〔13,14〕等)为前提,试图通过建立恰当的数理统计模型来反映被试特质水平、试题参数与该被试在试题上的反应表现之间的关系。相对于CTT,IRT的优势主要有:(1)具有试题独立性和样本独立性,即扣除测量误差的影响后,被试能力参数的估计值不会随试题的不同而不同,试题参数的估计值也不会随被试的不同而不同。(2)每位被试具有相应的测量误差。(3)考虑了每位被试的反应组型。(4)引入了信息函数的概念,其可代替CTT中信度的概念〔15〕。IRT克服了CTT的不足,已逐渐成为试题评价的主流理论。许多大型的考试如美国的研究生入学考试GRE及著名考试TOFEL等试题评价均采用了IRT〔16〕。本文也将应用IRT,阐述医学统计学标准化试题库建设的基本思路。
资料与方法
1.资料
从中山大学公共卫生学院资料库中搜集2008年至2011年期间的医学统计学考试试卷,共5116份。试题题型主要是单项选择题、简答题和计算分析题。这些试题面向7个不同专业的考生,包括临床专业、预防专业、药学专业、法医专业、口腔专业、康复专业以及护理专业。此外,这些考生来自于不同层次,包括本科生、硕士生。
2.方法
IRT强调的核心是数学模型的建立和对模型中各个参数的估计〔13〕,通过对模型中各个参数适当估计和选取,解决在现实中CTT遇到的大部分问题。IRT假定学生对测试项目的反应不仅受到特定“能力”的影响,还受到许多随机因素的影响,其将被试的能力看作是一个潜在的不可观测的变量,同时将难度、区分度、猜测度等参数看作是项目的固有属性,独立于被试样本,并将被试在某项目上的反映情况与该被试的特质水平联结起来,与表示试题特性的参数一起,共同建立起数理统计学概率模型〔17,18〕。不同形式的数据应采用不同的模型进行拟合。本研究拟应用IRT,从以下几个方面进行分析。
(1)考生反应组型的整理
采用EpiData3.1软件包,根据搜集到的试题输入每位受试者的反应组型(responsepattern),即:考生在一组测验试题上的作答情形。数据处理如下:对于单项选择题,假定某考生对试题i的反应为ui,其中答对用ui=1来表示,答错用ui=0来表示(属于二元化计分);对于简答题,每一道简答题满分为h=6分,我们将其分为以下四个等级:h=0分、0<h≤2分、2<h≤4分、4<h≤6分,分别用0,1,2,3来表示(属多元计分);对于计算分析题,每一道计算分析题满分为k=12分,我们将其分为以下四个等级:k=0分、0<k≤4分、4<k≤8分、8<k≤12分,分别用0,1,2,3来表示(属多元计分)。
(2)模型选择
①单维三参数logistic模型(3parameterlogisticmodel,3PLM)对于单项选择题,其反应数据为二元化计分形式,项目反应理论中可采用的数学模型有logistic模型和正态卵形模型,其中应用最广的是前者〔9〕。logistic模型根据参数数目的不同,可分为单参数模型、双参数模型和三参数模型〔19〕。在理论和实践中,三参数模型得到了充分的验证,相对成熟、可靠,并且可以提供更多的试题信息,能更好地对参数进行估计〔20〕。因此,本文对单项选择题的数据采用单维三参数logistic模型〔21-22〕进行处理,其表达式如下:Pi(θ)=ci+(1-ci)eDai(θ-bi)1+eDai(θ-bi)(1)其中θ表示考生能力估计值;ai表示第i题的区分度系数;bi表示第i题的难度系数;ci表示第i题的猜测度系数;D表示标化因子,一般取D=1.702〔19〕;Pi(θ)表示能力为θ的人答对此题目的概率。②等级反应模型对于简答题和计算分析题,将原始分数进行转化后,反应数据变换为多元计分形式,此时,可采用项目反应理论中的等级反应模型〔23-25〕(gradedresponsemodel,GRM)。GRM假设每一个反应类别各自对应一条特征曲线,如果对某试题i而言,被试的反应可以划分为g+1类,其得分可以表示如下:Xi=0,1,……,g,那么被试在该试题上恰好得某一等级g分的概率可表示如下:Pi,k(θ)=P*i,k(θ)-P*i,k+1(θ)(2)公式(2)中,Pi,k(θ)表示对于试题i而言,能力值为θ的被试恰好得k分的概率;P*i,k(θ)表示对于试题i而言,能力值为θ的被试得k分以及k分以上的概率,P*i,k+1(θ)表示对于试题i而言,能力值为θ的被试得k+1分以及k+1分以上的概率。其中P*i,k(θ)按双参数logistic模型可以写为:P*i,k=11+e-Dai(θ-bi,k)(3)公式(3)中,θ、ai、D的含义与公式(1)相同,bi,k表示第i题第k个等级的难度系数。
(3)试题参数估计
应用MULTILOG软件,采用最大边缘似然估计〔26,27〕(marginalmaximumlikelihoodestimate,MMLE)法来估计IRT模型中的参数。以L(ui|θ)表示能力为θ的某考生对题目i的反应ui(答对:ui=1;答错:ui=0)的概率,用对数似然函数表示为:L(u1,u1,…,un|θ)=∏ni=1PuiiQ1-uii(4)其中n为题目数,Puii表示考生答对第i题的概率,Q1-uii表示考生答错第i题的概率。当各参数的偏导数为0时函数取得最大值,分别求得每一个试题相应参数值,即:试题区分度系数ai,难度系数bi,猜测度系数ci。
(4)试题筛选入库
在筛选试题以决定哪些试题可以入库时,不能仅以试题参数作为能否进入试题库的唯一标准,需同时考虑估计出的各试题参数以及任课教师的专业意见,筛选符合一定标准的试题进入试题库。试题难度过大或过小,会使分数呈偏态分布,从而使考试的信度系数值降低,因此,选取难度系数位于[-4.0,4.0]范围内的试题进入试题库。区分度越大的题目,表明对学业水平不同的考生的鉴别力或区分能力越强。通常,教学过程完毕后进行的考试,是以考察考生对知识掌握情况为目的的,因此,区分度不应过大。我们选取区分度位于[0,3]范围内的试题进入试题库。此外,试题的猜测度也不应太大,猜测度系数过大的试题对于考察学生对知识的掌握意义不大〔28〕,我们将猜测度小于0.25的试题选入试题库。根据试题参数筛选出试题后,再由5~7位任课教师,独立地逐一对初步筛选的试题进行审核,以判断试题文字表述是否恰当、是否会引起歧义、是否符合医学统计学逻辑、是否具有考试价值、是否具有内容典型性、是否具有编写格式统一性,是否重复等,经全部任课教师认可的试题方能最终进入试题库。除了将试题及试题参数录入数据库外,各个试题库还应包括试题编号、试题类型、所考知识点、认知层次、参考答案、选中标识等。医学统计学标准化试题库建立的流程图见图1。结果该研究的预期结果是成功建立医学统计学标准化试题库,该试题库以单个试题为基本单位,每道试题都有编号、题型、难度、区分度、猜测度、知识点、认知层次、参考答案以及选中标识这9个属性,且试题库中的试题参数都建立在同一量尺上。试题库中的所有试题均符合大纲要求,且试题知识覆盖面广,每一章节均有一定数目的试题。该试题库可用于期末考试,也可用于阶段性小测验,可供临床、口腔、康复、护理、预防医学等专业使用,可根据不同专业的不同要求(如预防专业的学生应该掌握医学统计学知识,考试时理应选取难度较大的试题进行测验;而康复专业的学生理解医学统计学知识即可,那么考试时应选取中等难度或低难度的试题进行测验)选取试题,进而实现自动化组卷或者计算机自适应考试,从而使各种考试得以方便、快速、顺利地进行。结论与讨论采用项目反应理论建立的医学统计学标准化试题库可以满足各种目的的考试要求。不仅大大节省了时间、节约了人力,还使考试更加客观、公正,具有重大的实际意义。
在建设医学统计学标准化试题库的过程中,以下几个问题值得引起我们的注意:
1.必须明确医学统计学的教学大纲,并结合本校的实际情况列出考核知识点,然后将搜集到的试题归类于相应的知识点。以知识点而非章节作为试题的属性,更便于我们有针对性的命题、将试题进行分类以及对试题进行搜索。
2.在考生人数和试题库试题题量方面,当然是考生人数越多,试题参数估计的稳健性越好;选入试题库的题量越大、试题知识覆盖面越广越好。但是在实际中,由于考生人数以及符合大纲要求的试题题量有限,可以先根据现有的资源创建试题库,然后不断地修正试题参数,不断地为试题库注入新的“血液”,使试题库不断的发展完善。为了增加试题库题量,我们还可以借鉴兄弟院校的试题,或者组织经验丰富的专家或教师命制新的试题。
3.每一道试题须包括以下9个属性:编号、题型、难度、区分度、猜测度、知识点、认知层次、参考答案以及选中标识,以便于对试题进行分类、存储、检索、维护与管理。
4.医学统计学试题往往带有各种数学符号、表格甚至图形,这就提醒我们在录入试题前,应选择合适的软件平台,以保证所有的试题均能完整无误地输入或输出试题库,以确保各种工作的顺利进行。
[关键词]地质统计学;环境科学;水体污染;大气污染
doi:10.3969/j.issn.1673 - 0194.2016.12.139
[中图分类号]P628+.2 [文献标识码]A [文章编号]1673-0194(2016)12-0-01
地质统计学被称作空间信息统计学,是数学地质领域中发展较为迅速且具有广泛发展空间的一门学科。它将区域之间的变化作为理论基础,结合多孔介质空间结构变异函数,研究空间分布中具备一定规律性的自然现象,随后使用取样方案进行优化,对一些不规则取样进行处理并插值计算。在矿业、石油、农业、林业等行业中具有广泛的发展空间,取得了较大的研究应用成果。
1 地质统计学发展历程
20世纪中期,南非的矿物工程师DG Krige结合对南非金铀砾岩的研究经验以及对金矿储量的计算,根据样本区域位置的差异及样本关联性差异,首次提出了对每一个样本赋予相应的权值并在此基础上进行波动加权,以此方式代替传统的平均加权计算法。20世纪60年代,法国著名的统计学家G Matheron经过大量实验后,将DG Krige的研究升华为了具体的理论结果,并系统地提出了区域变量这个概念,由此形成了地质统计学这门新型学科。
地质统计学基本理论是在1978年由我国地质专家侯景儒引进的,前后历经了几十年的发展,至今为止无论是在理论方法还是实践应用方面都已经取得了一些进步,但是在环境科学领域方面的应用还不够成熟。
在短短的半个世纪内,地质统计学已经在各个领域中被广泛使用,目前为止形成了两个理论学派,其中一个是以法国统计学家G Matheron为主的“枫丹白露地质统计学派”,另一个是以美国的统计学及AG Journel为主的“斯坦福地质统计学派”,这两种学派根据其计算方法及应用方式的区别又分别被称为“参数地质统计”和“非参数地质统计”。地质统计学领域还出现了局部空间估计法如普通克立格法、对数克立格法和因子克立格法等。此外,我国一些相关领域的研究人员也研究出了一批以地质统计学为基础的软件。
2 地质统计学在环境科学方面的应用
20世纪初期,人们利用统计方法研究空间变异性,该方法提出将所收集的信息转变为单独的数值进行观测。可是随着信息化时代的发展,人们掌握的信息量越来越多,依靠收集的信息进行空间变异性研究的弊端越来越明显,很难实现对空间变异性的客观研究和评价。随着地质统计学的完善和进步,地质统计学在环境科学领域取得了很大的成就。
2.1 土壤环境研究中的地质统计学
自然环境下的土壤分布系统非常复杂,同样性质的土壤受土壤深度和周围环境的影响,土壤分布状况存在很大的差异。研究证明,土壤的自然密度、粒径等特性在同一水平或不同深度上的分布也是不同的。这些土壤特性的非均匀分布状态决定了土壤特性在空间中的变异性,从而导致土壤理化性质也存在一定程度的空间变异性。
2.2 地质统计学在水环境研究中的运用
水环境污染迁移参数的离散性与随机性两大问题是水环境污染领域中的重点研究课题。地质统计学被引进该领域之前,利用传统地下水水流和水质迁移模型的参数求证方式,对迁移参数的空间变异性进行合理的研究与评价。如果单纯使用确定性或偶然性的研究模型是很难正确且全面地描述整个水环境污染物迁移参数的变异背景,地质统计学可以对空间信息与偶然信息进行随机性处理,可以对这种随机性进行客观有效的分析。
2.3 地质统计学在环境科学其他领域中的运用
由于地质统计学可以有效描述同时具备结构性与随机性的环境参数,因此利用地质统计学研究大气污染物分布也有很好的研究效果,例如:孟健宇和马晓明就通过指示克立格法对某个城市大气中含有的二氧化硫浓度的变异特征进行分析与研究,最后得出该方法是研究大气污染差值的最佳手段这一结论。
3 地质统计学在环境科学领域中的展望
随着地质统计学的不断进步和完善,其实践方式和理论已经在环境科学研究方面得到了很好的应用,在土壤有毒物质研究以及水环境污染等研究课题方面取得了可观的成绩。由于土壤多孔介质特性中显著存在空间的变异特征,地质统计学对于这种随机性的事物来说是最佳研究手段。现阶段,对于土壤污染物的空间分布研究重点在重金属领域,并逐渐延伸到部分难降解污染物质的研究中,例如:影响内分泌物质及一些强致癌物质,他们的分布形态类似于重金属,地质统计学在这一类物质的研究当中具有十分突出的优势。自然界中含水介质的非均匀性导致了其他水环境污染参数迁移物质中具有高度变异性,特别是环境十分复杂的地下水环境系统。在以后的环境科学研究中,可以将地质统计学的分析方法、分形理论和灰色系统等一系列的研究方法和相关理论结合在一起进行使用,这样不仅会进一步降低研究复杂性,还可以更加准确地进行污染物迁移预测以及污染物迁移参数的价值估算,提高环境科学研究的准确性和先进性,为环境模拟和环境评价建立高效、科学的模型。
4 结 语
将地质统计学的研究理论和方法,与地理信息系统的研究工具相结合,为目前的环境科学研究提供了更加科学有效的研究方法。在此基础上将地质统计学的应用扩大到其他领域中,比如:水体污染和大气污染研究领域,可以通过地质统计学更加科学、客观地评价环境污染。
主要参考文献
[1]陶月赞,郑恒强,汪学福.用Kriging方法评价地下水监测网密度[J].水文, 2003(2).
关键词 统计学 教学探索 案例教学
中图分类号:G424 文献标识码:A DOI:10.16400/ki.kjdks.2016.05.038
Abstract Statistics is a science dealing with data, it provides a set of relevant data collection, processing, analysis, interpretation and draw conclusions from the method. In the teaching practice, there is a serious "teachers to teach students how to learn." In this paper, according to the author in recent years in the teaching process of Statistics found that some of the problems, combined with their own experience and feelings, the teaching of statistics for a number of exploration, put forward the corresponding recommendations.
Key words statistics; teaching exploration; case teaching
统计学是一门处理数据的科学,它所提供的是一套有关数据收集、处理、分析、解释并从中得出结论的方法,研究的是来自各领域的数据。①随着数字化进程的不断加快,人们越来越多地希望能够从大量的数据中总结出一些经验规律来为未来的决策经营提供依据,统计方法和技术的应用也就显得越来越重要。教育部也将“统计学”列为经济管理类专业的核心必修课,然而在教学实践中,“统计学”是一门教学难度较大的课程,存在严重的“教师难教,学生难学”的问题。在推进地方性院校向应用型本科学校教学改革,培养社会发展需求的高素质应用型人才的实践过程中,如何提高统计学课程的教学效果,提高学生的统计学理论的应用能力,成为许多统计学老师一直在思索的问题。
1 经管类专业统计学教学过程中面临的问题
(1)课程内容比较抽象,学习难度相对较大。统计学中存在着一些抽象的概念并且涉及到较多的公式和计算,和数学课程有点类似。有些内容的理解需要一定的数理基础,例如讲到参数估计和假设检验时,需要学生有一定的概率论基础,了解什么是随机事件,在此基础上才能理解什么叫置信水平,为什么在假设检验中会犯两类常见的错误,如果学生对置信水平,原假设,备择假设这些基本概念都弄不清楚,那么就很难对参数估计,假设检验这些统计工具进行灵活应用了。而讲到线性回归时,又需要学生具备一定的微积分知识,来理解利用最小二乘法进行参数估计的基本原理。同时,与其他经济学理论课程相比,统计学课程更强调逻辑性和推理性,缺乏趣味性,比较枯燥,部分学生不了解统计的用途和作用,认为自己和统计的距离比较遥远,因而认为学统计学没有用,因而不想学。
(2)学生数理基础薄弱,畏难情绪严重。经管类专业的学生在招生时是文理兼收的,而且以文科生居多,学生的数学基础相对较差,之前的微积分,概率论课程学得不太好,因此看到数字和公式较多的统计学,下意识地将其归类为一门数学课程,认为“这是一门数学课程,我肯定学不会”,产生严重的畏难情绪,同时也为自己不学统计学找到了借口。在笔者和学生的交流中,有的学生反映自己碰到数学类的课程必定挂科,所以统计学肯定是学不好的。再加上地方性院校学生一般学习目标不明确,自控能力不强,自主学习能力不佳,②统计学学的学得不好,也就不足为怪了。
(3)教学过程中过于注重理论,没有做到理论与实践相结合。统计学是一门研究方法论的课程,其生命力在于应用。③但是在实际的教学中,教师往往过于强调理论的讲解和统计公式的推导,使用的语言过于过于专业化,④对统计指标背后的统计思想挖掘不够深入,学生不能理解统计指标背后的统计思想和经济含义,只知其然而不知其所以然,为了通过期末考试而死记硬背公式,不能对统计指标所代表的经济含义进行解释,也就不能利用统计指标来分析经济问题了。这无形中也进一步加深了统计学就是一门数学课程的印象。这一方面是因为教师的知识体系不够全面,在教学中“以不变应万变”,同样的案例反复讲解于不同的专业,不能选取与学生专业相关的最新经济管理类案例,做到与学生专业的紧密结合,没有让学生体会到统计学在经济管理中的应用价值,不能激发学生的学习兴趣和学习动力。
(4)教材的选用存在一定难度。虽然《统计学》的教材很多,但是普遍存在这样或那样的问题,而且基本没有针对经管类学生的专门统计学教材。现行的统计学教材普遍存在重理论,轻实践的缺点,强调公式与计算,内容深奥不够通俗,部分案例过于陈旧。贾俊平教授等编著的《统计学》教材教师认为较好,有excel和SPSS的操作步骤,单从学生的反映来看,学生普遍反映该教材的推断性统计部分公式较多,案例过于陈旧,不具备良好的示范作用,增大了学生的学习难度和畏惧心理。
2 提高统计学教学效果的对策
(1)引入案例教学,激发学生学习兴趣。紧跟时事,精选一些最新与经济管理类的统计学案例或新闻,通过案例将统计学理论与经济时事结合起来,一方面可以提高学生的学习兴趣,明白统计学在经济专业中的重要性与应用性,另一方面可以提高学生分析和解决实际问题的能力,加强学生对统计指标的理解。如讲到数据的概括性度量时,可以引入统计局公布的最新全国平均工资水平,对比民众的吐槽来说明平均数的局限性,从而说明众数和中位数的适用范围。也可以通过经典的消费函数来解释线性回归方程中的相关概念,深入浅出的解释线性回归的基本思想,激发学生的学习兴趣,让其感受到统计学确实是一门应用性学科,同时也可以提高学生的应用能力,将不同学科的知识联系起来对问题进行综合分析。
(2)注重理论与实践的结合,引导学生进行具体的统计实践。在讲解描述性统计学相关的知识时可以给予学生自己动手实践的机会,设计经济学相关的问题,让学生根据所学的统计知识,设计调查问卷,选择合理的调查方式进行调查并收集数据,最后对调查结果进行分析,撰写出调查报告。在讲解推断性统计学时可以要求学生自行搜集数据进行预测分析等。一方面可以激发学生的学习兴趣,另一方面可以提高学生的实践能力。适当增加上机课时,要求学生能够利用excel和SPSS软件进行数据分析,达到学以致用的目的。
(3)改革现有的考核方式。考试作为检验学生对知识掌握的一个工具,是教学中非常重要的一个环节,传统的闭卷考试虽然能够在一定程度上反映学生对知识的掌握程度,但是许多学生为了通过考试,考前突击对知识点进行死记硬背,并不能理解相关的概念和统计指标。而统计学作为一门工具类的学科,更应当注重的应该是学生的技能训练和综合能力的培养,所以应当改革现有的闭卷考核方式,采取综合考核的形式。综合考核应当包括知识体系的考核以及技能考核。知识体系的考核主要包括学生平时上课的表现和闭卷考试的表现。平时成绩的考核一方面从学生听课及回答问题的表现,另一方面通过Kahoot平台对学生进行随堂测验。技能考核则包括学生的调研报告和平时上机课的表现。调研报告通过分组调研,撰写调研包括的形式进行考核,上机课则要求学生必须在课堂上完成要求的作业,课后撰写实验报告。
(4)加强“双师型”教师队伍的建设。高水平的“双师型” 教师队伍是地方应用型本科院校办学实力的体现, 是推动学校持续、健康发展的内在动力,是培养高素质应用型人才的关键。⑤地方应用型本科院校立足于为区域经济社会发展服务,第一要务是培养适应区域经济发展需要的人才,“双师型”教师具备丰富的经济常识,综合素养较高,对行业前沿动态把握准确,在培养学生动手能力方面更能发挥作用,能够传授给学生行业中最新的应用性技能,使学生能很快适应工作岗位的需要。同时“双师型”教师阅历较为丰富,能够及时更新课程内容,做到与课本知识行业发展的及时对接,激发学生的学习兴趣。
3 结语
统计学作为一门应用性的学科,传授给学生的是一种方法论。学生对知识的掌握程度主要反映在两个方面:一是学生的调查研究能力,要求学生能够针对实际问题设计问卷,选择适当的调查方式搜集数据。二是学生分析处理数据的能力,要求学生能够对搜集到的直接或者间接数据进行描述性分析,从中找到规律,并能够在此基础上进行进一步的推断分析,对分析出来的结论能够进行合理解释。对统计学的教学改革探讨从教学观念到教学过程以及最后的考核方式都要围绕着两个能力的培养来进行。当然,统计学教学中还有很多的问题与困难,统计学教学探索的道路还很漫长,深化教育改革,实现地方院校向应用型高校转型,培养兼具学识素养和实践创新能力的高素质人才,需要学生、老师和学校等多方面的努力。
注释
① 贾俊平,何晓群,金进勇.统计学(第六版)[M].中国人民出版社,2015.
② 刘金龙,张君霞,赵琳琳.不同类型高校学生自主学习能力差异研究[J].科教文汇,2014.9.
③ 白日荣,苏永明.非统计专业统计学教学的改革与创新[J].教学研究,2007.
【关键词】统计学 平均思想 应用
一、统计学的基本内容
统计学的基本内容由描述统计、推断统计和实验设计三部分构成。
(一)描述统计(descriptive statistics)
是对实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均。如在集中量数中将原始数据进行平均,在差异量数中将离均差进行平均,在相关量数中将积差进行平均等。通过描述统计的工作,我们可以把大量零散的、杂乱无章的资料加以简化、概括,从而更加清晰明确地显示出这些数据的分布特征。
(二)推断统计(inferencial statistics)
又称抽样统计(sampling statistics),它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应的总体。换言之,就是根据已知的情况推测未知的情况。推断统计主要用于两个方面,一是从单一样本得到的统计量去推断较大总体的有关特征,我们称之为统计估计或参数估计。二是比较多个样本或总体的差别情况,评价一项实验的结果,我们称之为假设检验。
描述统计和推断统计均是针对数据进行计算的分析方法,因此,只要有数字我们就可以进行计算和分析。然而,要使这些数据真实、可靠地反映客观现实,首先要保证其本身的可靠性和有效性,因此仅靠分析方法是远远不够的,还需要一种获得准确数据的理论与方法,即实验设计。
(三)实验设计(experimental design)
是研究如何更加合理、有效地获得观测资料,怎样更正确、更经济、更有效地达到实验目的,以揭示实验中各种变量关系的实验计划。实验设计的具体内容包括怎样选择被试,控制那些无关因素,提出什么样的假设,观察哪些实验内容,如何安排实验步骤,采取何种统计方法来处理和分析实验结果等。实验设计时,每一项调查、测量和实验事先都必须进行合理的设计才能实施。有人曾说,假如给我三天的时间做研究,我会用两天的时间进行设计,用一天的时间进行实施,可见实验设计在整个统计学中的地位。
三者之间的关系:统计学的内容之间既互相区别,又互相联系。从统计学发展的历史来看,先有描述统计,后有推断统计,再有实验设计,因此描述统计为前驱,推断统计为核心,实验设计为后衍。但是从实验研究进程来说,则应先进行实验设计,再进行描述统计和推断统计。
二、几种基本的统计思想
统计要认识的对象是一个总体,按统计总体的定义,它必须是许多事物的集合。统计的总体思想使统计始终要站在研究对象的整体角度来看问题,形成了大量观察方法和一系列认识规律。既然统计学是通用的数量认识模式,就需要我们对这些模式进行总结。这既是学科内的必需,也有利于弄清统计学与其他学科的区别。
统计思想包括平均思想、变异思想、估计思想、相关思想、拟合思想、检验思想。平均概念几乎涉及所有统计学理论,是统计学的基本思想,算术平均数是简明而重要的代表。均值思想告诉我们统计认识问题是从其发展的一般规律来看,侧重点不在总规模或个体;所谓变异指的是个别对一般的偏离程度,个体变异在宏观上看就是方差。可以说,算术平均数与方差这两个概念分别起到“隐异显同”和“知同察异”的作用。平均与变异都是对同类事物特征的抽象和宏观度量;估计的本质是类比,把已知的事物特征推广到更大的范围,以样本推测总体,是对同类事物的由此及彼式的认识方法;相关概念表现事物之间的关系,它的度量对象是“关系”,是多维现象,是前述统计思想的重要扩展;拟合是对不同类型事物之间关系之表象的抽象。拟合的成果是模型,反映一般趋势,趋势表达的是“事物和关系”的变化过程在数量上所体现的模式和基于此而预示的可能性;统计方法总是归纳性的,其结论永远带有一定的或然性,基于局部特征和规律所推广出来的判断不可能完全可信,检验过程是保证判断可靠的逻辑要求。
三、平均思想的基本内容
在成像科学领域,学生和业内人士越来越迫切的需要掌握一些必要的理论知识和科学工具,以实现数据的定量分析处理。在本书中,成像、光学和光电子学的统计学研究能够为许多领域提供必要的分析技术手段,例如遥感、色彩学、印刷和天文学等。作者将重点聚焦在统计推断上,提供了广泛的相关统计方法,在成像、光学和光电子学与统计数据分析之间搭建了一座桥梁。
本书共有10章:1.简要介绍了本书的读者对象、使用方法、组织架构等;2.统计基础,对统计方面的基础理论知识展开详细描述,包括统计思维、数据格式、绘图方式、概率分布等;3.统计推断,讲述了参数点估计、假设检验、总体样本、人口分布的概率图和测试及蒙特卡罗模拟等;4.统计模型,包括模型简介、回归模型和实验设计分析等;5.多变量统计的基础,主要包括多变量随机抽样、多变量数据可视化、样品几何形状、广义方差等;6.多变量统计推断,包括平均向量推论、两个总体的均值矢量比较、方差-协方差矩阵的推论等;7.主成分分析,主要讲解其定义和性质、停止规则、残差分析、统计推断等;8.典型相关分析,描述数学公式、实际应用、典型相关回归等理论;9.判别和分类,主要包括两个或几个总体分类和空间平滑的分类分析;10.聚类分析,包括相似和非相似方法、层次和非层次聚类算法等。
本书强调几何直观的概念理解,所有的例子都比较简单,并提供背景解释。贯穿全书的习题集和解决方案包含部分数值计算结果,读者可以方便地确认自己方法的准确性。
本书是成像科学多变量统计学课程中一本非常优秀的图书,适合本科和研究生阅读。该书也可为从事成像、光学和光电子学领域每天需要进行数据处理分析的专业人士提供有价值的参考。
Peter Bajorski博士是罗切斯特理工学院统计学系的副教授,他在统计学研究领域包括回归技术、多变量分析、实验设计、非参数方法和可视化方法等,成像研究包括光谱图像目标检测等。
聂树真,
助理研究员
(中国科学院光电研究院)
Nie Shuzhen,Assistant Professor
(Academy of Optoelectronics,CAS)
关键词:Shiny;可视化;交互式;假设检验
1引言
Shiny[1]是一种基于web的可视化交互式应用程序,是RStudio开发的一种技术。它是R软件的web应用框架,将现有的R脚本转换成Shiny的应用程序并不困难,用户不需要学习R语言语法,也不需要在R源代码中进行更改就可以使用并绘制图形[2]。本文将使用Shiny应用程序对统计学中的假设检验与区间估计的知识点进行统计教学,所生成的程序允许学生操作方程中的变量,通过图像直观展示结果,从而更好地理解这些变量之间的关系,将假设检验中的一些概念理解得更为透彻。
2案例一
假设检验不仅是一种定量分析的重要方法,也是大学阶段统计学课程教学的重点之一[3],现实生活中有大量的实例可以归结为假设检验的问题。在讲解之前,同学们需要了解假设检验是立足于小概率,给定很小的显著性水平去检验对总体参数的假设是否成立。
当原假设与备择假设互斥时,肯定原假设,意味着放弃备择假设;否定原假设,意味着接受备择假设。
利用Shiny绘制出服从正态分布的假设检验的示意图并设置好相应用于互动的参数范围,学生可以指定不同的显著性水平,观察检验图会有怎样的变化,熟悉检验图的构造。在这里需要注意的是显著性水平和置信水平不是同一概念。在图1中,显示的是显著性水平的单侧检验示意图,图中的红线所在的位置表示的是临界值,红线的左侧区域我们把它称作拒绝域,正如图1所标示的位置。当观察结果落入拒绝域中表示拒绝了原假设,此时犯了第Ⅰ类错误,虽然这类错误发生的概率非常小,但是无法避免。图中红线的外侧面积大小表示着的大小。而红线的右侧区域,我们称作接受域,即接受提出的原假設。
我们了解了检验示意图的基本构成以后,我们再利用双侧检验示意图来观察在不同显著性水平的情况下是怎样变化的。学生通过操作左侧下拉按钮选择不同的显著性水平,其中图2、3分别选择的是在、时的双侧检验图,对比观察到随着显著性水平的提高,拒绝域就会越大。
3案例二
由样本统计量所构造的总体参数的估计区间就称为置信区间[5]。置信区间是一个估算值,它具有多个组件,包括点估计、样本量、标准误差和置信度。这些组件是理解其中的关键,改变置信区间的多个组件可以提供更深入的了解。总而言之,关键是学生要学会辨识置信区间的细微差别,以及它们在确定置信区间时所扮演的角色。下面通过把一电影票房数据的置信区间及自行生成的多个样本数据可视化,以便说明Shiny在这一过程中的应用。
很明显在图4中求了出31部电影平均首周票房的95%的置信区间为(2096.56,3569.15)。在图片的左侧是学生可以操作的模块,学生可根据不同置信水平来观察确定置信区间的变化,其中系数设置有0.01、0.025、0.05、0.1等,分别对应的置信水平为98%、95%、90%、80%。而右侧部分的线图则是Shiny应用程序的结果显示。学生通过点击下拉按钮选择不同的置信系数,可以得到发生改变的置信区间。图4中显示的下限是通过从点估计中减去误差来计算的,教师需要先进行例题示范教学,然后就可以让学生自行操作了。
图5是显示90%置信水平下的区间,建立图5是为了与图4形成对比,比较在不同的置信水平下的置信区间是怎样改变的。当样本量给定时,置信区间的宽度随着置信水平的提高而增大。
在教科书中,学生大多是通过静态图像来接触这些主题,而往往很少使用动态的交互式工具进行探索。在Shiny程序中,学生可以通过自己“动手”操作,发现其中的规律变化,加上教师的讲解以及鼓励可以激起学生的学习兴趣,还能引发学生更深层次的思考,将统计概念理解透彻,为后面学习统计分析奠定基础。
我们知道在实际问题中,进行估计往往只抽取一个样本,此时构造的是与该样本相联系的相应的置信水平下的置信区间。因为这个区间不再是一个随机区间,所以无法知道这个样本所产生的区间是否包含了总体参数的真实值[4]。因此我们建立了图6来说明样本量对置信区间的影响,我们选择的是重复构造出的的10个置信区间(数据均为随机生成)。图6中的每一条线段表示的是每一个估计区间,而红色的线段则表示不包含真实值的区间。图中可以看出10个区间中的第2个和第10个区间没有落在中间的黑线上,即表示包含总体均值。图6展示的是置信度为90%的置信区间,说明了最后有10%的区间没有包含。
在图6的左侧,有两个选择键,其中samplesize表示的是样本容量,Numberofalpha是置信系数,图6、图7构建的意义是为了比较在保持置信水平不变的情况下,增加或减少样本大小的影响对其影响范围的置信区间是如何改变。它将提供学生关于什么是直观的信息,引导学生操作结果展示图中左侧的按钮,这样的教学方式可以引发学生自主思考,还有利于培养学生的观察能力。
不仅如此,还可以通过给定样本量为30时,将系数选择为0.01,即置信度为98%时得到图8,用来说明置信度与真实覆盖率的关系。图7与图8的对比结果相当明显,可得到结论:当置信度越高时,区间包含真实值的概率也就越大。学生使用Shiny程序进行学习,不仅改变了被动接受知识的状态,还充分调动了学生学习的积极性,教师可以发现教学效果得到显著的提高。
医学统计学是一门运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学…。我国高等医学院校中,医学统计学作为专业基础课程是各医学类专业学生的必修课。在医学生中开展医学统计学教育,可以培养学生发现问题、分析问题和解决问题的能力,使学生具备最基本的开展科学研究工作的思维、态度和素质。这种基本科研素质的培养是研究型大学高素质、创新性、复合型人才培养过程中不可或缺的重要环节。在医学统计学的教学活动中,准确、快速地评价学生知识掌握的程度能够有效指导日常教学工作的改进和教学质量的提升。目前以笔试为主的评价方式仍然是最广泛了解学生的水平重要手段。本文通过对武汉大学2008级临床、口腔和检验等医学类专业本科生医学统计学考试试卷评测和结果分析,了解各专业学生知识的掌握程度,以期为今后医学统计学教学提供参考。
1对象与方法
1.1研究对象选取武汉大学医学部2008级临床、口腔和检验医学专业医学统计学试卷共354份(临床273份、口腔54份、检验27份)作为研究对象,不分性别,逐题统计得分情况。试卷由6道名词解释(3分/题)、l5道选择(2分/题)、5道简答(6分/题)和2道分析计算题(分别为:10分和12分)构成。
1.2研究方法对各题目难度值(P)进行计算。难度值反映了每个题目的平均得分率,其计算公式为:P=,其中为P为第i题的难度值,为第iAma题的平均得分,为第i题的总分。对于单项选择题,由于存在因机遇而答题正确的可能,因此采用以下校正公式计算其难度值。P=其中P为校正后的难度值,m为选择题中的选项个数。对试题按难度值大小分组,P≥0.8的为组1,认为较易;0.6≤P<0.8的为组2,认为中等难度;难度值P<0.6为组3,认为较难。同时,对每道试题按章节进行归纳,试题所涉及的章节共有十二章,分别为:第一章医学统计中的基本概念(c1);第二章集中趋势的统计描述(C2);第三章变异程度的统计描述(c3);第四章抽样误差与假设检验(c4);第五章t检验(C5);第六章方差分析(c6);第七章相对数及应用(c7);第八章卡方检验(C8);第九章非参数检验(C9);第十章线性相关与回归(C10);第十二章统计表与统计图(C12);第十三章医学实验设计与诊断试验的评价(C13)J。若一道试题包括了多个章节内容,则以其主要考查知识点所在章节为准。分别统计各专业在各难度分组和各章节的平均得分率,并比较其得分率的差异。
1.3统计分析所有资料采用epdata3.1建库。试卷的信度分析,通过计算克朗巴哈(Cronbach)系数仅进行评价。计算各试题得分与总分间的Pearson相关系数,来比较各试题间区分度的大小。由于得分率呈偏态分布,同时检验专业的试卷数较少,因此各专业得分率差异的比较采用Kruskal—Wallis检验。另外,属于第二、三、九章内容的题目仅有一道选择题,专业间得分率差异的比较采用X检验,所有的统计分析均使用统计软件包SPSS17.0进行分析。
2结果
2.1试卷分析试卷难度、区分度以及各试题平均得分情况如表1所示。在共28道试题中,按难度值划分较易(P≥0.8)的题分占总分的50%、中等难度(0.6≤P<0.8)占34%、较难部分(P<0.6)占16%,试卷平均难度为0.72,说明试卷整体难度不大,见表1。按项目区分度度标准(区分度0.4以上为优良、0.3—0.39间为合格、0.2—0.29问为尚可、0.19以下为应淘汰)j,本套试卷各区分度等级的分数占总分比例分别为:61%、11%、1l%和17%。区分度尚可及以上的试题分数占总分比例达83%,平均区分度为0.34,说明试卷整体区分度合格。选择题4和选择题14的区分度分别为一0.04和O.04,其难度值分别为0.95和一0.07,说明前者过于简单而后者又太难,其区分度均无统计学意义,在以后的试卷中类似题目应予以回避。克朗巴哈(Cronbach)系数Ot是目前最常用的信度系数,一般认为系数应达到0.7以上。本套试卷信度分析克朗巴哈系数仅为0.739,因此考试的结果可信(见表2)。
2.2不同专业得分率的比较按不同难度以及章节比较各专业学生平均得分率的结果如表2所示。三个专业在难度组1的得分率非常接近,并均高于0.75,随着难度的上升,得分率呈现了下降的趋势。检验专业得分率下降的幅度明显大于其他专业,在占总分34%和16%的中等及以上难度部分的平均得分率仅为0.62和0.39,经Kruskal—Wallis检验,P<0.05。结果表明不同专业对较大难度题目的解答能力可能存在差异。各专业学生在不同章节平均得分率的结果显示,医学统计学的基础部分(c1一C4、C12)如:统计学的基本概念、统计描述(统计图表)以及假设检验等知识的掌握情况良好,其平均得分率为0.84,各专业得分率间无显著差异。在统计推断部分(c5一C10),除第九章非参数检验外,其平均得分率均在0.7左右,各专业间差异无统计学意义。然而第十三章医学实验设计与诊断实验的评价部分,检验专业学生平均得分率仅为0.53,明显低于临床和口腔专业学生的平均得分率0.70和0.77,经Kruskal—wallis检验,P<0.01。
3讨论
试卷分析的结果显示,尽管有部分考题存在偏易或难的问题,但是其占总分的比例不到20%,大部分试题的区分度均在一个相对合适的范围之内,信度分析的结果也提示了考试结果可信,因此该套试题能够客观反映学生知识的掌握程度。通过对三个专业的学生在不同难度以及不同章节得分率的分析,发现对于较容易的医学统计学基础知识的掌握程度比较理想,不存在专业上的差异。然而随着难度的增加,检验专业学生的得分率较其他专业下降明显,章节别得分率的分析结果也显示出相似的趋势,尽管其差异大部分无统计学意义。这一结果提示,即便进行相同的授课,专业背景不同的学生对知识掌握的程度可能存在差异。专业的差异决定了学生兴趣点的不同,在对不同专业学生开展大课教学时,应该适当地关注授课对象的专业特点,进行有针对性的举例,从而调动学生积极性,增强学生的学习兴趣,达到各专业学生间相同的教学效果。
如何有效提高医学统计学本科教学质量一直是从事医学统计学教学的教师所关注的一个核心问题。提高教师自身素质、增强教学中师生的交流互动、灌注专业英语知识、加强统计软件教学力度以及积极开展案例教学等都能一定程度地提高医学统计学本科教学质量,而针对授课对象的差异开展有针对性的教学同样是保证教学效果和提高教学质量的重要手段之一。
《医学科研方法》的主要内容包括医学基本科研方法的讲解、医学文献的阅读、医学科研论文的写作等,可以使医药专业的学生了解医学科研的基本方法和基本程序,开阔学生的视野,激发学生对医学科学研究的兴趣以及对专业的热爱。为今后的就业和继续深造做好铺垫。
随着高校人才培养模式的转变,从原来的培养临床医生转变到了培养全面的医学创新人才。医学创新型人才应有浓厚的创新意识、高尚的创新人格、丰富的创新知识、饱满的创新精神、活跃的创新思维、高超的创新能力、科学的创新实践[2-3]。为了适应这种转变,很多医学类院校都在研究生中开设了《医学统计学》、《医学科研方法》这两门课程,以达到培养全面型人才的目的。近年来,逐渐在本科学生中也开设了这两门课程。
在医学科研相关内容的学习中,《医学统计学》、《医学科研方法》是相辅相成、相互促进的两门课程[4-6],但是我在教学中发现,我校的医学类专业学生的课程设置中,有的专业两门课程都学习了,有的专业只学习了一门课程,两门课程都学习的专业中,有的设置在同一学期,有的设置在不同的学期。为了探讨课程设置的最佳效果,我对这几类班级做了调查。
一、对象与方法
1.1 研究对象
以2012级医学本科本学期开设了《医学统计学》的班级为研究对象,分成三大类,分别是在学习《医学统计学》之前没有学习过《医学科研方法》的班级、在学习《医学统计学》之前的某学期学习过《医学科研方法》的班级、以及在学习《医学统计学》的同时正在学习《医学科研方法》的班级,在这三类中分别随机选择一个班级作为研究对象,称为甲班、乙班和丙班,共208人。这三个班级所使用的《医学统计学》和《医学科研方法》的教材一致,授课学时、内容相同。
1.2 研究方法
采用问卷调查的方式,给研究对象发放调查问卷。
1.3 统计学处理
资料录入和分析均采用SPSS17.0软件,计数资料采用卡方检验的方法进行统计分析。
二、结果
2.1 调查问卷结果
在整个学期的教学结束以后,对所选三个班的同学进行问卷调查,结果见表1、表2。
三、讨论
《医学科研方法》这门课程主要的教学内容为:科研设计的基本概念、科研设计的三要素、科研设计的原则、科研设计的类型、动物实验、医学文献的阅读、医学论文的写作等。《医学统计学》的主要教学内容为:医学统计学的基本概念、数据的分类、t检验、方差分析、卡方检验、非参数检验等。
在本次调查中,上过《医学科研方法》的班级对科研的兴趣和了解比未上过《医学科研方法》的班级要高,差别有统计学意义(P<0.05),这说明医学科研方法确实有开设的必要,能让学生们在本科的学习阶段对科研有所了解,为以后的深造打下基础。
在内容上,医学统计学中学生们会学习到的统计学方法,都是与医学科研方法中学习到的科研设计类型相对应的,在没有上过医学科研方法课程的班级中,就需要教师额外给学生讲解相对应的科研设计类型,并且还要给学生解释统计在医学中的应用,这就耗费了上课的时间,且很多学生在上课时简单的讲解中并不能很好的理解各种科研设计类型。如果两门课程分开两个学期进行教学,学生们对之前的内容就会有所遗忘,因此乙班和丙班两个班级的大部分学生都觉得将两门课程放在同一个学期教学能促进相互的理解,内容上显得更加的连贯。
本次研究只是对《医学统计学》和《医学科研方法》这两门课程在内容理解上的相互促进进行了初步的探索,为以后的学生培养方案的改革提供了一定的依据。但在任何课程的教学中,教学效果不仅仅是由培养方案中的课程开课顺序决定的,对教学效果有影响的还有教学模式,要将好的教学模式与合理的培养方案结合起来,才能培养出具有实际运用能力的、全面发展的学生。
关键词:贝叶斯;统计方法;统计方法
中图分类号:O21文献标识码:A文章编号:1005-5312(2011)15-0244-01
一、贝叶斯统计与经典统计的主要区别
英国学者T.贝叶斯1763年在《论有关机遇问题的求解》中提出一种归纳推理的理论,在其他统计学者的努力下,发展为一种系统的统计方法,称为贝叶斯方法。贝叶斯统计研究的内容,就是采用这种方法作统计推断所得的全部结果。20世纪 30 年代,认为贝叶斯方法是唯一合理的统计推断方法的统计学者,组成数理统计学中的贝叶斯学派。到50、60年代,已发展为一个有影响的学派。现在,随着贝叶斯统计方法应用的日益广泛,其影响越来越大。
贝叶斯统计中的两个基本概念是先验分布和后验分布。先验分布。总体分布参数的一个概率分布。贝叶斯学派的根本观点,是认为在关于总体分布参数的任何统计推断问题中,除了使用样本所提供的信息外,还必须规定一个先验分布,它是在进行统计推断时不可缺少的一个要素。他们认为先验分布不必有客观的依据,可以部分地或完全地基于主观信念。后验分布。根据样本分布和未知参数的先验分布,用概率论中求条件概率分布的方法,求出的在样本已知下,未知参数的条件分布。
二、贝叶斯方法的一些应用
(一)检测实验
我们设定一个普通的检测结果的可靠度与敏感度为99%,指的是,吸毒的被检测者,每次检测呈阳性的概率为99%;而不吸毒的被检测者,每次检测呈阴性的概率为99%。按照经典的统计方法,检测结果的概率为99%,检测结果是比较准确的。但是贝叶斯定理却可以揭示一个另外的问题:假设某单位将对它全体成员进行一次检测(检测结果是阳性的表示吸毒),已知0.5%的雇员吸毒。我们需要了解的是,检测结果为阳性的成员吸毒的概率有多高?令“A”=成员吸毒,“B”=成员不吸毒事件,“C”=检测结果是阳性。利用贝叶斯公式可得
P(A)即成员吸毒的概率=0.005。因为经过统计,已知该单位的成员中有0.5%的人吸食,所以P(A)就是A的先验概率。
P(B)即成员不吸毒的概率=0.995=1-P(A)。
P(C|A)即吸毒者被检测呈阳性的概率,这是一个条件概率,由于阳性检测准确性是99%,因此P(C|A)=0.99。
P(C|B)即不吸毒者检测呈阳性的概率,也就是检测出错的概率,为0.01,因为不吸毒的成员,其检测为阳性的概率为99%,因此,不吸毒者检测呈阳性的概率 即P(C|B)=1-99%。
P(C)即不考虑其他因素的影响,检测出成员吸毒的概率。该值为0.0149或者1.49%。通过全概率公式计算,得到:P(C) = 吸毒者阳性检出率(0.5% x 99% = 0.495%)+ 不吸毒者阳性检出率(99.5% x 1% = 0.995%)。P(C)=0.0149是检测呈阳性的先验概率。即:
P(C)=P(C,A)+P(C,B)=P(CA)P(A)+P(CB)P(B)
综上所述,我们可以计算检测结果为阳性的成员吸毒的概率P(A|C)=33%:
因此,我们得到结论:虽然我们的检测结果可靠性为99%,可靠度与敏感度都很高,但是如果某成员检测呈阳性,那么他吸毒的概率大约只有33%,也就是说此人不吸毒的可能性仍然比较大。
(二)如何取饼干
我们假定有两节坐满乘客的车厢E和F。车厢E内有 10 个人为男性,30 个为女性,而车厢F则男性和女性均为20 个。我们随机地取一节车厢,并随机的出来一个人。假定我们会对这两节车厢没有区别对待,乘客也是随机走出来的。结果走出来的为女性。问我们该女性乘客是从车厢E中走下来的可能性是多少?
依照我们的数据,我们猜想,显然这个概率大于50%,因为车厢E中有更多的女性。但按照贝叶斯统计方法,我们可以得到精确的概率。令 A 对应车厢E,而 B 对应车厢F。我们认为车厢E和车厢F是平等的,即有 P(A) = P(B),并且P(A) + P(B) = 1,所以P(A) = P(B)=0.5。定义事件 C是走出来的女性乘客。根据车厢乘客的数据,我们知道 P(C| A) = 30/40 = 0.75 及 P(C| B) = 20/40 = 0.5。根据贝叶斯公式,得到
P(A―C)=0.6
我们选择车厢E的概率为其先验概率P(A)= 0.5。在使用贝叶斯公式计算后,我们将概率精确为P(A|C)=0.6。
因此,我们认为该女性很可能从车厢E下来是因为直觉,因为相对另一节车厢它有更多的女性。但用贝叶斯方法,我们可以得到精确的,更贴近现实的结论。
关键词:护理干预 老年人 拔牙 安全
中图分类号:R473.78 文献标识码:B 文章编号:1672-5085(2008)5-0012-02
老年人在患有口腔疾病的同时,还可患有多种的全身疾病[1]。他们由于年老体弱多病,往往对接受拔牙会有恐惧、焦虑、担忧等心理问题,使患者在拔牙术中处于高度紧张状态,引起血压、心率的变化,诱发心血管意外及其他并发症出现。故有针对性的护理干预、完善的心理诱导是高效安全实施拔牙术的必要前提。笔者对我科2007 年6月至2008 年1月行拔牙术的94例老年患者,就护理干预能否影响患者血压、心率的变化进行了观察,现报告如下:
1 资料与方法
1.1 一般资料 选择2007 年6 月至2008 年1 月在我科就诊的年龄>60 岁的老年患者94 例,随机分为A 组(常规护理组),B组(护理干预组),两组患者的年龄、性别、病情比较差异无统计学意义(P>0.05),具有可比性。拔牙原因为无法治疗的残根、残冠和重度牙周病松动牙,研究对象均病情稳定,思维正常,知情同意。
1.2 方法 患者仰卧于牙椅上平静5 分钟,采用多参数心电监护仪监护,缚无创袖带于患者上臂并与病人的心脏在同一水平线上自动测量血压、心率,记录拔牙前、拔牙中、拔牙后20 分钟患者的血压、心率。麻药采用法国碧蓝公司生产制造的碧蓝麻1.7ml/支,专用卡局芯及注射器。对A组患者采用常规护理配合,B 组患者在常规护理基础上运用护理干预。
1.3 统计学处理 计数资料比较采用χ 2检验。
2 护理干预的措施
2.1 认知干预 护士根据患者病情、年龄、文化程度、接受能力深入浅出地向患者讲解拔牙的概念、原因,拔牙过程中及拔牙后的注意事项,告知患者患牙残留的弊端,同时说明目前修复技术可较好地恢复咀嚼功能,使患者明确拔牙的必要性。
2.2 心里干预 热情接待患者,主动与患者沟通,介绍诊室环境、医护人员的技术水平及我院的先进医疗设备,解除思想顾虑,采取安慰、鼓励等措施使患者情绪稳定,向患者说明拔牙是安全的,不会有痛苦和危险,减轻心里负担,消除恐惧、焦虑不安的心里。
2.3 行为干预 采用“四手操作”的护理配合,护士将患者扶到牙椅上调至舒适,配合医生给患者打麻药,同时与患者进行一些适当的交谈,分散其注意力,让患者感觉有安全感。
3 结果
两组患者拔牙中血压变化与拔牙前的比较情况见表1
表1可见,拔牙中比拔牙前A组患者血压升高18例,B组患者血压升高8例,经统计学处理χ 2 =5.32,P<0.05,差异有统计学意义。
3.2 两组患者拔牙中心率变化与拔牙前的比较情况见
表2可见,拔牙中比拔牙前A组患者心率增快13例,B组患者心率增快5例,经统计学处理χ 2 =4.40,P<0.05,差异有统计学意义。
3.3 拔牙后患者休息20分钟测得血压、心率均降到术前测量基础。
4 讨论
拔牙过程中,老年人出现血压、心率变化的原因复杂,正常剂量的碧蓝麻对血压及心率不会产生明显影响[2],因为老年人体弱多病,对自己身体能否承受拔牙存在紧张和恐惧心理,使人体处于应激状态,产生的内源性肾上腺素使血压和心率出现暂时性升高和加快。从表1和表2可以看出,经过护理干预的B组患者拔牙中血压、心率升高比常规护理组少,这些病人术后经过20 分钟休息观察血压、心率均可降到术前基础,说明护理干预能消除患者的紧张情绪,使血压、心率的变化不大。
据文献报道影响老年患者拔牙安全性的主要因素是血压升高、心率加快[3]。拔牙前多数患者存在焦虑心里,引起紧张恐惧而导致术中心血管指标变化,术中疼痛敏感度增加[4]增加了拔牙并发症发生的可能。本研究对这些老年患者存在的心里问题进行了总结,大致概括为:对患牙拔除的必要性理解不够;惧怕拔牙术中出现疼痛、出血、伤及神经或邻近组织,甚至怕拔错牙;担心术后出血不止,剧烈疼痛、面部肿胀等并发症,甚至怕出现心血管意外;害怕术后咀嚼功能障碍,导致胃肠功能失调而影响全身健康。故针对这些问题我们采用了相应的护理干预措施,减轻了患者的心里负担,使患者在拔牙过程中血压、心率处于平稳状态,减少并发症的发生,对安全拔牙具有重要意义。
参考文献
[1] 刘洪臣. 老年口腔医学进展[J].中华老年口腔医学杂志,2003,1(1):3.
[2] 祁劲松,白志伟. 老年心血管病患者拔牙术的多参数监测结果分析[J].中华老年口腔医学杂志,2004,2(1):20.