时间:2023-06-05 09:57:17
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇应用统计学,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
魅力无限的花园学府
我是浙江工商大学2003届的学生。是下沙新校区的第一届学生,我们常常戏称自己是这里的开拓者,新校区在下沙高教园东区,东临钱塘江,远眺萧山观潮城。风景怡人,虽然最初条件不是很好,但到处是一片新气象。开拓者的感觉很让人精神振奋,
随着建设的快马加鞭,学校的设施也逐渐完善,如今呈现在眼前的,是青灰色的统一建筑,整齐、干净、大气而美丽,小河像血脉一样连通着校园,一片片草坪绿得耀眼,点缀着年轻的小树――在和煦的阳光下,杭州细腻的美景中。或看书或聊天,非常惬意;如今再一次从设计精美的求知泉、蓝天碧水的月亮湾、大气的启航广场走过,看着三五成群的学弟学妹,一脸笑容,一脸朝气,让已经失去校园滋补的我满是羡慕,不知不觉,我走到了校园最远处的鸽房,这是我最喜欢的地方,草坪上设计了几个专供鸽子休憩的木头房子,鸽子优雅地在草坪上踱步、飞扬,这种场景让人感到高贵而纯洁。
快离开教学区的时候,我又去瞻仰了一下学校的飞翔门,飞翔门――顾名思义,门的形状像展翅飞翔的鸟,气势磅礴,象征着莘莘学子即将起航飞扬神州大地。
浙商大的培养方法很独特,施行“子女战略”,视学生为子女,让学生在严格要求与热情关爱中健康成长,学校给新生寄教材。让他们早日开始大学的学习;实行早读和晚自习制度,这造就了学校良好的学风;在全校学生中聘任校长书记联络员,让学生直接和校领导交流,这些使得整个学校就像一个大家庭一样温暖。
枯燥而有趣的统计学
我学的是统计学,这是一个老牌专业,主要包括一般统计和经济统计两类专业方向,需要学习数学基础课(分析、代数、几何)、概率论、数理统计、运筹学、计算机基础、应用随机过程、实用回归分析、时间序列分析、多元统计分析、抽样调查、非参数统计、统计预测与决策、风险管理等,统计学是一个枯燥的专业,我们要和大量的数据打交道,堆积如山的各式表格看了都让人害怕,更别说还要去整理和分析这一堆堆冷冰冰的数字了,不过,统计学又是一个有趣的专业,毕竟它是和生活紧密联系在一起的。
你知道美女是怎么来的吗?美女都是被“统计”出来的。比如某一天你在街上闲逛,迎面走来一位女生,这时你就统计她出现在你面前时的心率,如果高于120次,就绝对可以称之为美女了,如果某一天你遇到一位让你心跳超过140次的女孩子。那在你看来,沉鱼落雁、绝代佳人都不足以形容这位美女,当然。你此刻的心情也无语言表。
你想知道你心仪的女孩子对你的态度吗?要看一个女孩子对你的态度究竟怎样。那你就统计去找她时,有多少次她会说自己忙、抽不出空来。或者不巧、没有办法、抱歉,如果这样的比例高于某个百分比,那你就该知道,再死缠烂打下去,也不会有好的结果。
你看,统计学是多么的有趣,居然关系到同学们的终身大事,当然这仅仅是一个玩笑而已,不过,它在现实生活中确实是很重要的,在现代,我们很难找到不会利用统计学的领域了,太阳每天从东方升起,但天安门广场上与太阳同时升起的国旗,其升旗时间却每天不同;冬天过去,春天就要来临,但今年的春色比去年更加明媚;物体失去支撑就会坠落,但受风速、风向、地心引力等很多细小因素的影响。两个同样重的物体坠落速度和落点会有差别;“神舟五号”飞船按设计的轨迹运转,但每次经过我国领空的时间都略有差距;经济按市场规则运行,但今年的GDP比去年增长8%;奔波的人们按自己的哲学度日,但一年又一年我们的生活逐渐发生了改变。
充满希望的就业前景
如前所述,现代统计学的应用是很广泛的,理、工、农、医、文、经,没有不用到统计学的,所以,它的出路不再尴尬。前途充满光明。
毕业后,你可以选择工作,去政府统计部门,银行、证券公司、保险公司等金融机构。信息咨询公司等,整体而言,如果英语比较好,统计分析能力强,并且具备一定的社会实践经验,就能够进入跨国公司与大牌的咨询公司,薪酬会非常高,在8000元左右,如果没有这方面的优势,薪酬就会比较一般,北京、上海、深圳等一线城市,普遍薪酬在4000元左右。
医学统计学是根据概率论和数理统计的原理, 结合医药卫生工作的实际情况, 研究实验设计和数字资料的搜集、整理、分析和推断的一门科学, 广泛应用于基础医学、临床医学、预防医学、药学和卫生事业管理等诸多领域。它是人们认识客观世界的一种重要手段, 现代科技工作者做科学研究或撰写论文, 很少看到不用统计学。
与此同时,如果统计学方法应用不当,不仅不能准确地反映科研结果,而且还可能带来错误的结沦。Rosenfeld 等比较了不同年表的文章,在20 世纪90年代以后有更多的文章使用了统计推断,而且比较复杂的统计分析方法如多因素分析等也更多的应用于临床研究中,但同时也存在使用统计方法欠妥或叙述不清的情况。
因此本文将对医学科技论文常见统计学方法的正确应用进行讨论,希望加强作者的统计思维,进而提高期刊论文的统计质量及学术水平。
2、统计学方法的内容
统计软件包、统计分析方法及检验水准是统计学方法必须描述的3 方面内容。SPSS (statistics package for social science) 和SAS(statistical analysis system ) 是全世界学术界公认且最常用的两大统计软件包[6]。检验水准即A,表示组间实际无差别而统计结果判断为有差别,犯这类错误的概率[1]。实际工作中常取 A=0.05,表示本次研究计算所得P 值必须小于0.05,才能认为组间差异有统计学意义。统计分析方法的准确描述是科技论文科学性的关键所在。统计学方法一般包括统计描述和组间差异性检验(即:假设检验) 两部分内容。
3、统计学方法的正确选用
统计方法的选择取决于研究设计、数据资料类型和变量值的分布。计量资料常用u检验、t检验(.配对t检验)、 F检验;计数资料用 检验;等级资料、偏态资料或不明分布的资料可用秩和检验等。每种显著性检验方法均有其适用范围, 如方差分析(F检验).要求数据服从正态分布, 且各总体方差齐, 否则不宜作方差分析, 若改用非参数统计方法, 则会降低统计效率, 故常在可能情况下, 通过变量变换(如对数变换、平方根变换、反正弦函数变换、例数变换等)使资料转换为正态分布, 以满足方差分析或t检验的应用条件。医学期刊中最常见的是t检验和 检验, 这两种方法误用也较为多见。
3.1重复t检验
多个样本均数间的两两比较(又称多重比较)不宜用t检验, 因为重复数次,t检验将增加第一类错误的概率, 使检验效率降低。此时宜用方差分析, 并在此基础上用两两比较方法..(如.SNK、LSD、Duncan法等)。对于同一对均数间的差异, 用t检验无显著性, 而两两比较可能有显著性, 可见错误选用统计方法将推出错误结论。
3.2行列标 检验误用
行列表 检验用于2个或多个样本率(或构成比).比较, 它要求行列表中不宜有1/5以上格子的理论频数T
3.3需要注意的统计学问题
3.3.1无足够的统计学信息
论文中未说明统计方法和 取值, 无均数、标准差或率及t值、 值等统计量, 甚至未作假设检验直接下结论。不少临床医学论文作者只在文中提及P值大小并据此推断结果的显著性。实际上, 临床医学研究关心的是各组之间结局(如疗效)的差别大小, 而不单纯是统计学显著性, 因此应同时说明检验方法、 水平、统计量值、P值和可信区间, 以便让读者了解所用的方法和结论是否适当及其临床的实际意义。
3.3.2统计图、表
统计图、表是统计描述的重要工具。统计图宜少而精, 应按资料性质和分析目的选用适合的统计图形, 统计图虽直观但不能代替精确的数据或统计量同。统计表宜简单明了, 层次清楚, 一般采用三线表。常见的统计表运用不当有.. 标题复杂或过于简略甚至无标题, 辅助线过多, 标目繁杂, 层次不清。另外, 表内不宜留空格, 暂缺或未记录可用“…” 表示, 无数字用“一”表示, 数字若是“0”则填明“0”。
3.3.3统计软件使用的误区
目前计算机应用已十分普及, 统计软件的使用也非常方便, 但软件只能解决计算问题, 并不能替代人脑的统计思维。根据资料的分布特征和数据特点选择统计方法, 正确地解释分析结果并推导出正确的结论, 这是科研工作者在做统计分析时必须首先掌握的, 计算只是一种工具。有了诸如SASA、SPSS等高级统计软件包, 复杂了多元分析如多重回归、多因素方差分析等已变得十分容易, 于是一些作者片面追求使用高深的多元统计方法且多种方法一起用, 误以为统计方法用得越高级, 文章水平越高。实际上如果使用不当, 多元统计方法使用得越多, 错误可能也越多。一个精心设计的临床研究, 资料可能用简单的t检验或 检验就足以说明问题, 若滥用多元分析、结果会适得其反。
4.结语
通过上面的分析,在医学研究中必须正确运用统计学,这是科研工作的科学性所决定的。搞科研,首先必须尊重科学。借助统计学这个有用的工具,可以去探索未知事物,揭示和阐明客观事物变化的规律性。
参考文献:
[1]于国艺, 周晓彬, 王俊. 医学论文常见统计方法误用分析.编辑学报, 1998;10(3):132.
[2]杨树勤, 主编.卫生统计学.第3版.北京: 人民卫生出版社, 1995;145-147.
主干学科:应用统计学。主要课程:数学基础课(分析、代数、几何)、概率论、数理统计、运筹学、计算机基础、应用随机过程、实用回归分析、时间序列分析、多元统计分析、抽样调查、参数统计、统计预测与决策、风险管理等,以及根据应用方向选择的基本课程等。
应用统计学专业主要包括一般统计和经济统计两类专业方向,培养具有良好的数学或数学与经济学素养,掌握统计学的基本理论和方法,能熟练地运用计算机分析数据,能在企业、事业单位和经济、管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作,或在科研、教育部门从事研究和教学工作的高级专门化应用型人才。
(来源:文章屋网 )
一、地质统计学的概述
地质统计学是1962年,法国著名统计学家G.Matheron在Traitédegéostatistiqueappliquée一文最早提出的,之后其他科学家大量理论研究的基础上逐渐形成的一门新的统计学与地质学的交叉学科。地质统计学所利用的是应用统计学。地质统计学因为具有空间的分布特点,而且是利用区域变量理论作为理论基础,因此地质统计学在矿产开发、资源开发、动植物研究、地质地貌方面都有着很突出的作用。之所以将它称作地质统计学是因为,它最早只是应用在地理科学当中。地质统计学的创立最初是由G.Matheron创造的,经过长时间的改造与发展,现在的地质统计学已经成为一门非常完善的数学工具了,而且它的应用也变得越来越广泛,由最初单纯的地理研究,发展到今天在地球物理、地质、生态、土壤等领域的广泛应用。
二、地质统计学在矿山储量分析当中的应用
地质统计学是以研究区域化变量为基础的,以变异函数为研究工具,研究在空间上具有随机性和结构性的自然现象的科学。地质统计学在矿山储量分析当中的应用中的原理大致分为以下几种:1.区域化变量区域化变量是地质统计学理论体系的核心基础,在实践中,钻孔的位置。在绝大多数情况下是不随机的。当两个样品在空间的距离很小时,样品间会存在较强的相似性,而当距离很大时,相似性就会减弱或不存在。也就是说,样品之间存在着某种联系,这种联系的强弱是与样品的相对位置有关的,样品之间的联系在空间上既具有随机性又具有位置之间的联系。2.半变异函数的数学模型通常情况下样品由于取样、化验误差和矿化作用在短距离内的变化,在绝大多数情况下半变异函数在原点不等于零。也就是会存在块金效应。但是地质统计学在矿山储量分析当中的应用在实际工作中区域化变量的变化性很复杂,通常要计算几个具有代表性的方向,然后通过结构分析,得到一个能代表其空间变异性的模型函数,由于区域化变量往往存在各向异性,不同方向上的半变异函数具有不同的变程,影响范围是一椭球体,即各向异性椭球体。在确定空间搜索椭球体时,不仅需要指出块金常数、基台、变程,还需要指定一些参数:圆锥体的容差角、容差限、滞后距等,各个参数的意义用几何图形表示。当然应用地质统计学法对矿山储量分析,被大部分人认为是一种较好的品位估值方法,尤其适用于品位变化大,矿岩界线由品位控制的矿床。在估值计算过程中,当有了足够的地质钻孔数据时,对矿床进行正式可行性评价时,选用地质统计学法是一种较好的方法,而在对矿床进行初步评价或是数据量不足时,就要首选较简单的方法。基于地质统计学原理和矿体三维可视化建模技术的DIMINE矿业软件,实现了按照不同的边界品位动态圈定矿体,能够以市场经济为向导,快速计算出矿体范围内的矿石量,并进行储量分级,在此过程中所得到的各中间参数,可以为投资决策和日常管理提供必要的参考依据。
三、地质统计学在勘探网度优化方面的应用
地质统计学在勘探网度优化中的应用主要要注意以下的两个个因素,其一是:构造复杂程度;二是煤层的稳定性。当勘探区的构造已经经过,详细的勘探,构造问题基本解决之后,勘探网度优化主要的问题就是煤层的稳定性。当一个煤田有两种或者是两种以上的煤层稳定结构时、应该按照储量和厚度占有优势的那一个煤层类型选择勘探网度的优化。应用地质统计学的方法对露天的在勘探网度进行优化,主要要分为两个步骤:其一是建立地质变量的最佳理论变差函数;其二是应用地质变量的估计方差评价勘探过程对矿床的控制程度。
四、结语
本文详细论述了地质统计学的概述、地质统计学在矿山储量分析当中的应用、以及地质统计学在勘探网度优化方面的应用,通过对以上问题的论述,我们更加清晰的认清了地质统计学以及地质统计学在固体矿山中的应用。就目前的情况而言,我国对地质统计学的认识还是不够充分的,大多数都将地质统计学看做一门非常复杂的科目,所以没有去进行深入的研究,所以,我国的地质统计学还处在一个非常初级的阶段,地质统计学的作用也难以在我国发挥出来。由于我国的地质状况非常复杂,与外国的地质状况非常不同,主要体现在:地质类型多、地质结构复杂、多高山、少平原、矿产资源丰富。因此地质统计学在我国的发展既有机遇同时也存在着挑战。总而言之,地质统计学在我国的研究是非常有意义的,但是因为各种条件的限制,我国在地质统计学上的发展还是不够完善,而且现在的地质统计学的应用不单单只限于地理科学方面的研究,它在各个领域都是有所涉及的,如环境科学、农田水利、气象、林业、海洋等领域均已涉及,因此,发展我国的地质统计学是现在非常重要的任务,因为地质统计学的高速发展有利于我国国民经济的快速发展,也有利于解决我国资源紧缺的问题。随着应用领域的不断扩大和方法本身的不断完善,地质统计学已逐步方展成一个通用的工具性科学。也希望我国能够通过地质统计学固体矿山中的应用中有很大的进步。
作者:冯艳娟 单位:河北省地质矿产勘查开发局第四地质大队
摘 要:随着我国经济发展水平的不断提高,各行各业得到了显著发展,数据统计学方法也变得日趋多样,数据挖掘是建立在数据库与人工智能基础上发展起来的一种高新技术,其功能是从众多的数据当中挖掘到最有价值的信息,进而实现对数据资源的高效利用。聚类分析能够被当成一种数据分析工具,能真实反映出数据分布情况,本文主要对统计学在数据挖掘中的应用进行了探讨,从而表现统计学在数据挖掘应用中的重要性。
关键词:统计学方法;数据挖掘;应用分析
数据挖掘就是指从众多实际应用数据中获取批量大、有噪声、且随机性强的数据,将潜在的信息与数据提取出来,就是从数据中挖掘有价值的知识,而大多数原始数据具有一定的结构化特征,比如,关系数据库中的数据;也可以通过文本、图形、图像等半结构化发掘有用知识,这些知识可以是数学的也可以是非数学形式的;数据挖掘能以归纳形式存在,能够被广泛应用到信息查询、信息管理、信息决策控制中,方便数据的维护与管理。由此可见,数据挖掘是一门交叉性强的学科,加强对其的研究非常有意义,下面将对统计方法在数据挖掘中的具体应用进行分析。
一、数据挖掘与统计学的关系
(一)数据挖掘的内涵
通常来说,数据挖掘的定义较为模糊,没有明确界定,大部分对其的定义只是停留在其背景与观点的内容上。通过对不同观点的统一整理,人们最终将其描述为:从大量多样化的信息中发现隐晦性、规律性等潜在信息,并对这些信息进行创造、加工的过程。数据挖掘作为一门重要的交叉学科,能够将数据库、人工智能、机器学习、统计学等众多的科学融入到一起,从而实现技术与理论的创新与发展[1]。其中,数据库、人工智能与统计学是数据挖掘当中的三大支柱理论。数据挖掘的目的是从数据库当中发掘各种隐含的知识与信息,此过程的方法非常多,有统计学知识、遗传算法、粗集方法、决策法、模糊逻辑法等,还可以应用向邻近的可视技术、模式识别技术等,在以上所有技术的支持上能够使数据挖掘更为科学、有序。
(二)数据挖掘与统计学间的关系
通常来说,统计学的主要功能是对统计原理与统计方法进行研究的科学。具体来说就是指对数字资料进行的收集、整理、排序、分析、利用的过程,数字资料是各种信息的归纳与总结,可以将其作为特性原理的认知、推理方法[2]。而统计学则表示的是使用专业的统计学、概率理论原理等对各种属性关系的统计与分析过程,通过分析成功找到属性间的关联与发展的规律。在此过程中,统计分析方法是数据挖掘最为重要的手段之一。
在数据挖掘这一课题被提出来之前,统计分析技术对于人们来说更熟悉,也是人们日常开展工作、寻找数据间规律最常使用的方法。但是不能简单的将数据挖掘作为统计学的延伸与替代工具,而是要将两者的区别认识到位,再结合两者间的不同特点分析其应用特点[3]。大部分的统计学分析技术都是建立在数学理论与技巧上的,预测通常较为准确,效果能够让大部分人满意。数据挖掘能够充分借鉴并吸收统计学技术,在融入到自身特点以后成为一种数据挖掘技术。
统计学与数据挖掘存在的目标都是一致的,就是不断对数据结构进行发掘。鉴于统计学与数据挖掘在目标上的一致性,致使很多研究学者与专家将数据挖掘作为了统计学的一个分支机构[4]。但是这种认知非常不正确,因为数据挖掘不仅体现在与统计学的关系上还体现在思想、工具与方法上,尤其是在计算机科学领域对数据挖掘起到的作用非常大。比如,通过借助数据库技术与人工智能的学习,能够关注到更多统计学与数据挖掘上的共通点,但是两者存在的差异依然非常大。数据挖掘就是指对大量的数据信息不断挖掘的过程,DM能够对数据模式内的数据关系进行充分挖掘,并对观测到的数据库处理有着极高的关注度。
二、数据挖掘的主要过程
从数据本身出发探讨数据挖掘过程,数据挖掘的过程分为信息的收集、数据集成、数据处理、数据变换、数据挖掘实施等过程。
首先,要将业务对象确定下来,明确不同业务定义,并认清数据挖掘的目的,这是做好数据挖掘最关键的一步,也是最重要的一步,虽然挖掘的结果不能被准确预测到,但却需要对问题的可预见性进行探索[5]。其次,还要做好数据准备工作,包含数据清理、数据变换等工作,数据清理的实际意义是将噪声与空缺值补全,针对这一问题,可以使用平滑技术,而空缺值的处理则是属性中最常见的,可以将统计中最可能出现的值作为一个空缺值[6]。
信息收集指的是按照特定的数据分析对象,可以将分析中需要的特征信息抽象出来,并在此基础上选择出较为科学、适合的信息收集方法,将全部的信息全部录入到特定的数据库中。如果数据量较大,则可以选择一个专门的管理数据的仓库,实现对信息的有效保护与管理;数据集成就是指将来源不同、格式不同、性质不同、特点不同的数据集成到一起,进而为企业提供更为全面、系统的数据共享平台;数据变换就是通过聚集、概化、规范化等方式对数据进行挖掘,对于一些实用数据,则可以通过分层与分离方式实现对数据的转换;数据挖掘就是结合数据仓库中的数据信息点,并选择正确的分析方法实现对有价值数据的挖掘,事例推理、规则推理、遗传算法等都是应用较多的方法[7]。
三、统计学方法中的聚类分析
在统计学聚类方法基础上能够构建出潜在的概率分布假设,可以使用试图优化的方法构建数据与统计模型的拟合效果。基于统计学聚类方法当中,Cobweb方法是在1987年由Fisher提出的,能够以分类树作为层次聚类创建的方法,在分类树上,每一个节点都能代表着一个概念,该方法就是对节点概率描述的过程。Cobweb方法还使用了启发式估算方式,使用分类效用对分类树的构建进行指导,从而实现对最高分类的划分目的,能够将不同分类对象全部归类到一个类别中,并依据这些内容创建出一个新的类别。但是这种方法也存在一定局限性,局限性在于假设的属性概率分布都是独立的,并不能始终处于成立状态中。
只有在掌握了Cobweb算法以后才能对概念聚类算法的特点进行探究。Cobweb算法能够以分类树方式创建层次聚类,可以将概率表现为p(Ai=Vii/Ck)条件概率,其中,Ai=Vij是一个类别下的,同属于一个值对,Ck是概念类中的一种。在给出一个特定的对象以后,Cobweb能够将全部对象整合到一个节点上,从而计算出分类效应,分数最高的效用就是对象所在的节点位置[8]。如果对象构建失去节点,则Cobweb能够给出一个新的节点,并对其进行分类使用,这种节点计算方法起步较晚,能够对现有的节点与计算相互对比,从而划分出最高的分类指标,将全部对象统一到已有的分类中,从而构建出一个新的类别。
Classitci是Cobw eb方法的一种延伸与发展,能够使用其完成聚类数据的处理,在该方法下,节点中的每一个存储属性都是处于连续分布状态中,能够将其作为分类效果修正的方法,并以度量的形式表现出来,这种度量基础上能够实现连续性的积分,从而降低分散发生率,该方法是积分过程而不是对属性的求和过程。
Auto Class方法也是一种应用较为普遍的聚类方法,该方法主要采用统计分析对结果类的数目进行估算,还可以通过模型搜索方式分析空间中各种分类的可能性,还能够自动对模型数量与模型形态进行描述。在一定类别空间中,不同的类别内属性存在关联性,不同的类别间具有相互继承性,在层次结构当中,共享模型参数是非常重要的。
还有一种使用较为普遍的模型是混合模型,混合模型在统计学聚类方法上使用也非常普遍。该方法最为基本的思想就是概率分布决定着每一种聚类状态,并且模型中的每一个数据都是由多个概率在分布状态下产生的。混合模型还能够作为一种半参数密度评估方法,其能够将参数估计与非参数估计的优点全部集中到一起,并将参数估计法与非参数估价法的诸多优点融合到一起,因为模型具有一定复杂性,为此,不能将其限制在概率密度函数表达形式上,这种复杂性决定了模型与求解存在关联,与样本集合的联系非常少。通过以上的研究可以了解到,数据发掘中应用聚类方法非常有效,并且较为常见。比如,构建出Cobweb模型与混合模型,采用Clara与Clarans方法中的抽样技术,将Denclue方法用在概率密度函数中。
结束语
统计学方法自产生开始已经有非常久远的历史,将严谨的数学逻辑作为基础,将分类算法假定作为独立条件,属性值之前能够相互保持独立,对假定进行计算,当假定成立时,可以再与其他分类算法进行对比,这种分类算法准确性非常高。为此,其不仅能够对连续值进行预测,还可以通过线性回归方程对系数进行比较,从而归纳出结果。
(作者单位:中国人民大学)
参考文献:
[1] 张爱菊.基于数据挖掘技术的瓦斯气体红外光谱定量分析方法的研究[J].光谱学与光谱分析,2013,33(10):2646-2650.
[2] 许长福,李雄炎,谭锋奇等.任务驱动数据挖掘方法的提出及在低阻油层识别中的应用[J].吉林大学学报(地球科学版),2012,42(1):39-46.
[3] 郑晓峰,王曙.基于粗糙集与关联规则的道路运输管理信息数据挖掘方法[J].华南理工大学学报(自然科学版),2014(2):132-138.
[4] 周复之.固定收益决策支持系统机理建模与数据挖掘的协同研究[J].系统工程理论与实践,2010,29(12):38-45.
[5] 张继福,张素兰,蒋义勇等.基于约束概念格的天体光谱局部离群数据挖掘系统[J].光谱学与光谱分析,2011,29(2):551-555.
[6] 张欣欣,缪弈洲,张月红等.CrossRef文本和数据挖掘服务――《浙江大学学报(英文版)》的实践[J].中国科技期刊研究,2015,26(6):594-599.
关键词 Excel;生物统计学;t分布;TINV函数;TDIST函数
中图分类号 G642 文献标识码 A 文章编号 1007-5739(2016)23-0271-02
生物统计学是研究数据资料的收集、整理、分析、解释的一门科学[1],也是畜牧、兽医、农学、微生物、医学等领域中不可缺少的统计工具,越来越多的数据分析离不开生物统计学的原理。随着计算机技术的发展,已经有更多的软件或操作系统被应用于生物统计学,如Excel[2]、SAS[3]、SPSS[4-6]等,但是不同的统计软件具有不同的统计特点,如Excel统计功能更为简单,适合生物统计学的初学者。SAS统计功能比较宽广,因其统计模块的限制,所以更适合能够自己编写程序的学者。SPSS的统计功能更为强大,几乎具备了所有的统计分析功能,操作相对简单、直观。虽然从统计分析上来看,SAS和SPSS的统计分析功能略胜于Excel,但是Excel也具有其独特的地方,如对一些常用分布的概率计算来说Excel就显得更简单。本文则针对Excel在生物统计学 t分布中的一些应用进行探讨。
1 t分布
2 Excel在t分布计算的应用
2.1 t分布的概率计算
例1:如果一个t分布的自由度(df)等于60,临界值(或者分位数)是2,求t分布的两尾概率是多少?求t分布的单尾概率是多少?
t分布的双尾概率是指在其分布的2个尾部(左尾和右尾部)概率之和,Excel中选定空格―插入―fx函数―统计―TDIST,在其对话框中从上至下依次输入2、60、2,具体见图2,其概率为0.050 0。
t分布的单尾概率是指在其分布的左尾部概率或右尾部概率,因为t分布是左右对称分布,所以单侧的左尾概率与右尾概率相等。Excel中选定空格―插入―fx函数―统计―TDIST,在其对话框中从上至下依次输入2、60、1。
2.2 t分布的R界值计算
例2:如果一个t分布的两尾概率为0.05,自由度(df)为10时,则其临界值是多少?
Excel中选定空格―插入―fx函数―统计―TINV,在其对话框中从上至下依次输入0.05、10,具体见图3,其临界值为2.228 2。
3 结语
在本科生的教学改革与实践中,已经把各种分布的概率计算纳入生物统计学的实践教学中,而且在概率计算这方面,Excel比较方便快捷。本文主要介绍了用Excel中 的TDIST和TINV函数在t分布中的应用,在用TDIST函数模块时,双尾概率和单尾概率的不同之处在于提示框中“Tails”的填写数字不同,双尾填“2”,单尾填“1”。而TINV函数只能提供双尾概率的临界值,如果要计算单尾概率的临界值,如单尾概率为0.01的临界值,则可以事先变换成双尾概率即 0.02,然后即可利用TINV函数计算出其临界值[7-8]。
4 参考文献
[1] 张勤.生物统计学[M].北京:中国农业大学出版社,2009.
[2] 王香萍,王文凯,李俊凯,等.EXCEL中关于生物统计中两组平均数的应用方法及探讨[J].考试周刊,2011(6):180-181.
[3] 黄中文,张丹.生物统计与SAS教学中大学生自主学习能力的培养[J].新乡学院学报(社会科学版),2013,27(5):140-142.
[4] 白俊艳,徐廷生,张小辉.《生物统计附试验设计》上机实验改革与实践[J].教育教学论坛,2015(18):247-248.
[5] 白俊艳,贾小平,张小辉,等.生物统计学课程改革与实践[J].畜牧与饲料科学,2013,34(10):57-58.
[6] 白俊艳,武晓红,张小辉,等.生物统计附试验设计课程考核方式的改革与实践[J].安徽农业科学,2015,43(5):369-370.
本文较系统地介绍了统计学在证券期货市场中的应用,其中包括作者的一些最新成果,如:证券期货市场指标体系的研究;新华财经指数的编制;证券投资组合的研究与应用等。
关键词:统计学 证券市场 期货市场
分类号:O212 C8 F832.5 标识码:A
文章编号:1002-1566(2000)01-0054-04
Application of Statistics on Securities and Futures Markets
LI Cong-zhu,DING Shao-fang,WANG Ling-hua,SUN Da-ning
(North China University of Technology,100041)
Abstract:In this paper,the Application of Statistics on Securities and Futures Markets is introduced,author's many new achievements are included in it,such as study of index system on Securities and future markets;study of Xin Hua index number of securities;study and application of investment in bond and so on.
Key Words:statistics securities markets futures markets
一、序
言
我国自九十年代初建立证券期货市场以来,短短几年,得到了迅猛,方兴未艾。仅拿股市来看(截至1999年07月13日),在沪深两市上市的境内公司已达900家,沪深市场的A,B股股数是981只,上市公司900家,其中沪市501只(461家),深市480只(439家),沪深A股股数874只,B股股数107只。这与1991年沪市8家深市6家上市公司相比,可见发展速度之快。市价总值21083亿元人民币,占国内生产总值的比重超过25%;开办证券90家,兼营证券业务的信托投资公司237家,下属证券营业部2400多家;现有43家境内海外上市,累计筹集资金100多亿美元;已有107家公司成功发行了B股,筹集资金近50亿美元;股民已达4000多万。自1999年五月十九日井喷式行情以来,沪深两市的日成交量猛增,至六月二十五日高达800多亿(1998年8月18日香港股市一天的成交量为790亿港元),创下空前的天量。证券市场的作用愈来愈大,并逐渐成为国民的晴雨表。
统计学及其相关学科在证券期货交易中有什么作用呢?我们先从世界范围谈起。
据有关报道,当今华尔街最抢手的不再是传统的MBA,而是有统计背景、数理能力强的人才。一些在美国获得统计或数学博士学位的留学生被华尔街录用,转眼间便当上了年薪百万美元的“白领”贵族。如,1984年入中国技术大学少年班的黄沁于1988年提前毕业,赴美国麻省理工学院就读研究生,毕业后受聘到华尔街某大型证券公司工作。在这个世界上证券业最发达的地方,他以统计和数学为基础,建立了自己的投资,现已升任该公司副总裁,主管对外投资工作。年仅27岁的黄沁是进入华尔街金融界高层领导的少数华人之一。
华尔街取才原则的转向,从一个侧面反映出证券期货等金融业发展面临的挑战和未来的潮流。证券金融交易是信息量最大,信息敏感度最强、信息变化频度最高的领域。随着市场日趋复杂,数字已成为传递信息最直接的裁体,加上未来的经济是被覆盖与笼罩的数字化经济,大量的数学与统计工具将在研究中发挥不可或缺的重要。能否把握那看似枯燥无味的数字所隐含的精微变化,成为决定未来竞争成败的关键因素之一。
前年诺贝尔经济学奖授予在期权定价方面做出开拓性贡献的经济学家和统计学家。他们在二十多年前就探索出具有划意义的定价模型——布莱克.斯科尔期定价公式。本世纪20年代开设了股票期权品种,由于采用柜台交易方式和缺乏标准化的设计合约,很难转让对冲,交易量不足称道。1973年美国经济学家布莱克和斯科尔斯,引进概率统计上随机变量函数的一些定理和积分求值,推导出不支付红利的股票期权定价公式,从此期权有了明确科学的价格定位依据,很快形成一个完整的市场,并迅速推广到全世界,直至现在,期权占据着金融王国的重要位置。定价公式成为整个市场运转的基础。这个期权公式的定价思想所引发的金融革命表现在,预测远期价格成为可能,不仅使期权为指数、货币、利率、期货交易提供了全新的保值,投资手段,极大地丰富了金融市场,而且进一步推动了对各种金融产品的价值研究,提高了操作的理论水平。由此可以推断,没有布莱克.斯科尔斯定价模型,期权就不可能发展这么快,全球金融衍生品市场也就不可能有今天的高度发达,如今国外大型金融机构在金融交易失利原因时,总是首先追究最初的定价是否存在漏洞和错误
建立一个模型就摘取领域的桂冠这一事实,体现了经济与统计数学密不可分的关系。据不完全统计,自1969年设立诺贝尔经济学奖以来的40多位获奖者中,著名的计量经济学家有23位,10位担任过世界计量经济学会会长,有六位直接靠计量经济的和成果获奖。借用统计数学,将经济数学公式化,将经济行为定量化,已成为当今世界经济的热门课题。
有关专家指出,统计学,经济理论和数学这三者对于真正了解经济生活中的数量关系来说,都是必要的,但本身并非充分条件。三者结合起来,就是力量。数学给经济界带来新的视角,新的观念。抽象的数学工具一旦准确地切入市场,就显得非常实用和有价值。二十多年来,指导期权交易的理论—定价模型得到广大投资者的一贯遵循。没有统计基础、不懂定价公式含义的人要想在市场有出色表现将是十分困难的。
证券金融市场的风险管理是个永恒的话题,投资者都想寻求收益回报,但又必须面对各种各样的损失可能。市场到底存在哪些风险,如何确定风险的大小,如何才能实现收益最大化和风险最小化,历来都是受人关注的焦点和难点。自从1952年美国学者马柯威茨运用数量创立证券组合理论以来,市场风险的神秘色彩逐渐淡化,不再变得那么可怕和不可驾驭。
马柯威茨组合理论的立足点是全面考虑“期望收益最大”和“不确定性(即风险)最小”。它通过投资损失的概率分布和可能收益与预期收益的偏离程度(即我们统计学上的方差),发现投资者应该同时按适当比例购买各种证券而不是一种证券,进行分散化投资,其收益才尽可能是确定的。通过数量得出的这种结论,迎合了投资者避风险的需要。风险管理能力的提高促进了基金的蓬勃。在短短的几十年间,随着量化研究的不断深入,组合理论及其实际运用方法越来越完善,成为现资学中的主流工具。由于马哥威茨证券组合选择理论给金融投资和管理思想带来革新,1990年他获得了诺贝尔经济学奖。
众所周知,量变引起质变。数量关系的背后,牵扯着市场的稳定与发展。金融业的现代化推动了统计与数理方法的应用研究,反过来,当今世界的金融管理特别是防范金融风险,也越来越要量化研究。早在1995年9月,美国斯但福大学经济学教授刘遵义就通过实证比较,数量分析和模糊评价等方兴,预测出菲律宾、韩国、泰国、印尼和马来西亚有可能发生金融危机。后来的事实果然如此。这从一个侧面提醒我们,没有完整、的分析预测工具,就可能在国际金融竞争中蒙受重大损失。只有加强对作为金融信息的各种变量的研究,才能提高对金融运行的认识,才能把握市场的发展动向。
经济理论的数学化和统计分析,使各种经济行为也越来越数量化。在金融领域也不例外。定价公式和组合理论地位的确立,就证明数量工具已发挥了不可磨灭的作用。有统计显示,在西方金融市场,三分之一的人运用组合理论来投资,三分之一的人靠技术分析管理头寸,另外三分之一的人仍在坚守基础分析。虽然运用何种手段来指导决策是投资者个人偏好、观念的,但组合理论和技术分析所运用的统计工具逐渐被认同,说明理性投资将成为市场的宠儿。由此我们不难理解华尔街选才的动机。
主观意见和直觉判断有很大的随意性,显然与现资决策的要求相去甚远。对市场和价格进行定量研究,从而揭示客观存在的数量依存关系,成为投资和管理决策的一项基础工作。用统计工具处理各种证券金融数据,可以比较全面地分析各种因素的力度。其主要表现在:
1 结构分析:证券市场与汇率、利率变动和国民经济发展有多大的关联度;单一证券与整个市场之间如何相互影响,市场指数设计是否合理;证券与期货价格走势是否相互制约;同一类证券有没有一定的连动关系。
2 价值预测:分析未来证券发行和上市价格的理论定位,确定金融衍生证券的价格,分析预测证券期货的价格走势,进行投资决策等。
3 政策评价:市场系统风险的预警及控制,探讨不同的组合投资效果。
4 检验:证券价格能否反映所有的信息,市场的有效性实证检验;各种技术指标的适用性和优化处理,周期效应的对比。
从以上可看出,量化研究有助于搞好风验管理,设计投资组合,选择交易时机,评估市场特性。统计工具在证券市场的大量,对交易技术的升级换代,管理水平的提高做出了特殊贡献。现在,电脑交易系统在国外大行其道,依据不同要求设计的模型软件层出不穷,只要把数据输入电脑中,投资者根据分析结果随时制订和调整投资计划。
投资者竞争的优势不再停留在信息的收集上,而是综合处理信息的能力。谁的模型从总量上与趋势上能更合理、地分析市场,谁就能掌握主动。
虽然统计学是一门基于数学的学科,但是它实在很枯燥!严格地说——如果你曾经不得不大量地研究双边置信区间、学生T检验以及卡方分布测试,有时你会觉得很难消化这些知识点。
一般来说,我是喜欢物理学和力学的,因为很多时候只需简单地分析一个事例,你就能核实现状。当你计算苹果从树上落下的速度及方向时,如果你的结果是苹果应以每小时1224英里垂直向上抛出,也就是实际上你已经在头脑中核实过结果了。
统计学的优势在于易理解且具合理性;而劣势在于它的奇特性。无论如何,这篇文章的话题不会让你觉得枯燥。因为大部分的话题都是有形的、属于重要的数据资料,你应有精力去慢慢摸索。
statistics(from wired.com)
统计学:黑暗的科学
统计学是所有学科领域中最易被邪恶势力滥用的科学。
统计学可以同邪恶行径相比较是因为在使用不当时,这门学科的分支就会被推断出各种无意义或者不真实的裙带关系(参见本文末尾的实例)。如果政治家或其它非专业人士掌控了统计学,那么他们就可以操纵一些重要决定。一般来说,基于错误总结的坏决策从来不受好评。
也就是说,使用得当时,统计学无疑非常有用且有益。而对于强权势力者来说,他们会将统计学应用于一些非法途径,甚至是一些纯粹无用的渠道。
统计学——所谓的争议
我已准备好作一个紧凑的总结,然而我注意到维基百科已经对统计学作了定义,而且语言几近诗歌体系。如下:
统计学是应用数学的一个分支,主要通过收集数据进行分析、解释及呈现。它被广泛应用于各个学科领域,从物理学到社会科学到人类科学;甚至用于工商业及政府的情报决策上。(Courtesy Wikipedia.org)
这真的是一段很感人的文章。特别是最后那句“用于情报决策上”。
当然,作者忘记添上“在游戏设计领域”,但是我们原谅他对这一蓬勃发展的新兴行业的无知。
以下为我自己撰写:
统计学是应用数学的一个分支,它涉及收集及分析数据,以此确定过去的发展趋势、预测未来的发展结果,获得更多我们需了解的事物。(Courtesy Tylerpedia)
如果将此修改为适用游戏设计领域,那可以如此陈述:
统计学为你那破损的机制及破碎的设计梦指引了一条光明大道。它为你有意义的设计决策提供了稳定且具有科学性的数据。
须知的事实
统计学同其它硬科学一样深奥且复杂。如同第一部分的内容一样,本文只涉及一些精选的话题,我自认为只要掌握这些就足够了。
再次突击测验
很抱歉我要采取另一项测试了。别讨厌出题目的人,讨厌测试吧。
Q1a)假设有20名测试员刚刚完成新蜗牛赛跑游戏《S-car GO!》中的一个关卡。你得知完成一圈的时间最少为1分24秒,最多为2分32秒。你期望的平均时间为2分钟左右。请问这个测试会成功吗?
Q1b)在同一关卡中你收集了过多的数据,在分析后得出这样的结果:平均值=2分5秒;标准差=45秒。请问你会满意这个答案吗?
Q2)你设计了一款休闲游戏,不久就要发行。在最后的QA阶段,你分布了一个测试版本,然后收集了所有的数据作为试验对象。你记录了1000多位玩家的分数,还有100多位特殊的玩家的分数(有些玩家允许重复玩游戏)。运算这些数据可知平均分为52000pts,标准差为500pts。请问这游戏可以发行了吗?
Q3)你设计了一款RPG游戏,然后收集数据分析新的玩家从关卡1到关卡5的游戏进程会有多快。收集的数据如下所示:4.6小时、3.9小时、5.6小时、0.2小时、5.5小时、4.4小时、4.2小时、5.3小时。请问你可以计算出平均值和标准差吗?
总体和样本
统计学的基础为分析数据。在分析数据的时候,你需要了解两个概念:
1.总体:
总体是指某一领域中所有需要测量的对象。总体是抽象的,只在你需要测量时候才会具体化。比如,你想了解人们对某一特定问题的看法。那你就可以选择地球上所有的人,或者爱荷华州所有的人或者只是你街道附近所有的人作为一个总体。
2.样本:
样本实际上就是指抽取总体中部分用于测量的对象。原因很明显,因为我们很难收集到所有总体的数据。相对来说,你可以收集部分总体的数据。这些就是你的样本了。
正确性及样本容量
统计学结果的可靠性通常由样本容量的大小决定。
我们完美的想法是希望样本容量就是我们的总体——也就是说,你想整个收集全部涉及到的数据!因为样本越少,你就需要估计可能的趋势(这是一种数学性的推断)。而且,数据点越多越好;你最好能建立一个大型的总体而不是小型的。
例如,相对于调查10000个初中生对《Fruit Roll-Ups》的感想,试想下调查人员能否询问到每一个学生。100万个的数目过于庞大,做不到的话,10万个也不错。仍然做不到,好吧,10000个刚刚好。
由于时间和费用的关系,通常呈现出的研究结果都是基于样本所做的调查。
1.统计学的常识性规则:
你无法通过一个数据点来预测整个趋势。如果你知道我喜欢巧克力冰淇淋,你不能总结所有的Sigmans都喜欢巧克力冰淇淋。如果现在你询问我家庭中的许多成员,然后你可能会得出关于他们的想法这类比较合理的结论,或者你至少知道是否能总结出一个合理的推断。
广泛的分布图(重点!)
由于种种原因,只有《The Big Guy》可以解释生活中的许多事情倾向于同一模式发展或者分布。
最普遍的分布也有一个合理的名称——“正态分布”。是的,无法匹配这一分布图的都为非正态,所以有点怪异(需要适当避免)。
正态分布也称“高斯分布”,主要因为“正态”一词听起来不够科学。
正态分布也称为“钟形曲线”(又称贝尔曲线),因为其曲线呈钟形。
bell curve(from gamasutra)
钟形曲线的突出特点是大多数的总体均分布在平均值周围,只有个别数据散落在一些极限位置(主要指那些偏高或偏低的数据)。中间成群的数据构成了钟的外形;而那些偏高数据或偏低数据分布在钟的边缘。
我们周围有上百万的不同事例呈现出正态分布的景象。如果你测量了你所生活的城市中所有人的身高,结果可能呈现正态分布。这表明,只有少数个体属于非正常的矮,少数个体属于姚明那样的身高,而大多数人会比平均身高多几英寸或者矮几英寸。
钟形曲线同样极典型地适用于调查人们的技能水平。以运动为例——极少部分人在这一领域为专业人士,大多数的人都还过得去,只有少部分的人实在不擅长,所以没有被选为队员(比如我)。
其它分布图
尽管正态分布图很完美,但它并非我们周围唯一的一种分布图。只是它比较普遍地存在。
比如有些其它的分布图直接与赌博及游戏设计有关,只要看下扔骰子的概率分布图,这种情况下出现了如下的d6情形及2d6情形:
D6 distribution(from gamasutra)
2d6 distribution(from gamasutra)
现在我想说的是第一个分布图看起来一点也不像钟形曲线,而第二幅图开始呈现出了钟的形状。
平均值
这一小块内容可以说是这篇冗长的文章中的一个小插曲。这块自我指涉的小内容的存在只有一个目的:提醒你什么是“平均值”。这块自我指涉且迂腐的小内容将被动地提醒你平均值是指一整套的数学平均数据。
方差和标准偏差
我们必须理解什么是方差和标准偏差,并且它们也具有许多有形的价值。除了能够帮助我们做出有价值的数据总结外,这两个术语还能够帮助我们更明智地陈述分布问题。比起说“中间聚集了大量的数据点”,我们可以换个说法,即“68.2%的样本是一个平均值的标准偏差”。
sigman(from gamasutra)
方差和标准偏差是相互联系的,它们都能够测量一个元素,即分散数据。直观地说,较高的方差和标准偏差也就意味着你的数据分散于四处。当我在投掷飞镖时,我便会获得一个较高的方差。
我们可以通过任何数据集去估算方差和标准偏差。我本来应该在此列出一个方程式的,但是这似乎将违背“听起来不像是一本教科书”的规则。所以我这里不引用公式,而是采用以下描述:
标准偏差:样本或人口统计的平均数值偏离平均值的程度。由希腊之母σ(sigma)表示。
举个例子来说吧,你挑选了100个人并测试他们完成你的新游戏第一个关卡分别用了多长时间。让我们假设所有数据的平均值是2分钟30秒而标准偏差则是15秒。这一标准偏差表明游戏过程中出现了集聚的情况。也就是平均来看,每个游戏过程是维持在平均值2.5分钟中的±0.25分钟内。从中看来这一数值是非常一致的。
这意味着什么以及为何你如此在乎这一数值?答案很简单。假设你不是获得上述结果,而是如下结果:
平均值=2.5分钟(如上)
σ=90秒=1.5分钟
所以我们现在拥有相同的平均值以及不同的标准偏差。这套数值表明玩家所用的游戏时间差别较大。90秒钟的游戏时间背离了平均游戏时间。而因为游戏时间是2.5分钟,所以这种偏差过大了!基于各种设计目的,出现这种较大的差值都不是设计师想看到的结果。
而如果我们所说的游戏时间是15分钟而标准偏差是90秒(1.5分钟)的话差别变更大了。
通过一个小小的标准偏差便能够衡量一致性。标准偏差比率除以平均值便能够获得相关数值。就像在第一个例子中,15秒/150秒=10%,而在第二个例子中,90秒/150秒=60%。很明显,60%的标准偏差真是过大了!
但是并不是说较大的标准偏差“总是”糟糕的。有时候设计师在进行测量时反而希望看到较大的标准偏差。不过大多数情况下还是糟糕的,因为这就意味着数值的差异性和变化性较大。
更重要的是,标准偏差的计算将告诉你更多有关游戏/机制/关卡等内容。以下便是通过测量标准偏差能够获得的有用的数据:
1.玩家玩每个关卡的游戏时间
2.玩家玩整款游戏的游戏时间
3.玩家打败一个经典的敌人需要经历几次战斗
4.玩家收集到的货币数量(游戏中有一个意大利水管工)
5.玩家收集到的吊环数量(游戏中有一个快速奔跑的蓝色刺猬)
6.在教程期间时间控制器出现在屏幕上
误差
误差与统计结论具有密切的关系。就像在每一次的盖洛普民意测验(游戏邦注:美国舆论研究所进行的调查项目之一)中也总是会出现误差,如±2.0%的误差。因为民意调查总是会使用样本去估算人口数量,所以不可能达到100%精准。零误差便意味着结果极其精确。当你所说的人口数量大于你所采取的样本数量,你便需要考虑到误差的可能性。
如果你是利用全部人口作为相关数据来源,你便不需要考虑到误差——因为你已经拥有了所有的数据!就像我问街上的任何一个人是喜欢象棋还是围棋,我便不需要考虑误差,因为这些人便是我所报告的全部数据来源。但是如果我想基于这些来自街上行人的数据而对镇上的每个人的答案做出总结,我便需要估算误差值了。
你的样本数量越大,最终出现的误差值便会越小。Mo data is bettuh(越多数据越好)。
置信区间
你可以使用推论统计为未来数据做出总结。一个非常有效的方法便是估算置信区间。理论上来看,置信区间与标准偏差密切相关,即通过一种数学模式去表示我们多么确定某一特定数据是位于一个特定范围内。
置信区间:即通过一种数学方法传达“我们带着A%的置信保证B%的数据将处于C和D价值区间。”
虽然这个定义很绕口,但是我们必须知道,只要具有一定的自信,我们便能够造就任何价值。让我以之前愉快但却缺乏满足感的工作为例:
我过去是从事应力分析和飞机零部件的设计工作。如果你知道,或者说你必须知道,飞机,特别是商业飞机的建造采用的是现代交通工具中最严格的一种形式。人们总是会担心机翼从机身上脱落下来。
作为飞机建造工程师,我们所采取的一种方法便是基于材料优势属性设置一个高置信区间。关机设计的传统置信区间便是“A基值许可”,即我们必须95%地确信装运任何一种特殊材料都有99%的价值落在一个特定的价值区间内。然后我们将根据这一价值与可能发生的最糟糕的空气条件进行设计,并最终确立一个最佳安全元素。
当你真正想了解某种数据值时,置信区间便是一种非常有帮助的方法。幸运的是在游戏中我们并不会扯到生死,但是如果你想要平衡一款主机游戏,你便需要在设计过程中融入更多情感和直觉。计算置信区间能够帮助你更清楚地掌握玩家是如何玩你的游戏,并更好地判断游戏设置是否可行。
不管你何时想要计算置信区间,备用统计规则都是有效的:越多数据越好。你的样本中拥有越多数据点,你的置信区间也就越棒!
你不可能做到100%的肯定
这便引出了另一个统计规则:
并不存在100%之说:你永远不可能创造一个100%的置信区间。你不可能保证通过推论统计便能够预测一个数据点具有一个特定的价值。
当玩家在《魔兽世界》中挑战任务时,唯一可以确定的只有死亡,税金以及不可能找到最后的Yeti Hide。所以玩家只需要接受这些事实并勇往直前便可。
滥用
我在之前提过,统计是一种邪恶的技能。为了更好地解释原因,我写下了这篇弹头式爱情诗:
十四行诗1325:美好的统计,让我细数下我滥用你的每种方式:
1.误解
2.未明确置信区间
3.只因为不喜欢而丢弃了有效的结论
4.基于有缺陷的数据而做出总结
5.体育实况转播员的失误——混淆了概率和统计错误
6.基于一些不相干元素做出总结
误解
人们一直在误解统计报表。我知道,这一点让人难以置信。
未明确置信区间或误差
置信区间和误差是信息中非常重要的组成部分。在过去30天内有43%的PC拥有者购买了一款可下载的游戏(误差为40%)与同样的陈述但存在2%的误差具有巨大的差别。而如果遗漏了误差,便只会出现最糟糕的情况。我们需要始终牢记,小样本=高误差。
只因为偏见而丢弃了有效的结论
操作得当的话,统计数据是不会撒谎的。但是人们却一直在欺骗自己。我们经常在政治领域看到这类情况的出现,人们总是因为结论不符合自己预期的要求而忽视统计数据。在焦点小组中亦是如此。当然了,政治领域中也常常出现滥用统计结论的现象。
基于有缺陷的数据而做出总结
这种情况真是屡见不鲜,特别是在市场调查领域。你的统计结果总是会受到你所获得的数据的影响。如果你的数据存在缺陷,那么你所获得的结果便不会有多少价值。得到有缺陷的数据的原因多种多样,包括失误和严重的操作问题等。提出含沙射影式问题便是引出能够支持各种结论(就像你所希望的那样)的缺陷数据的一种简单方法。“你比较喜欢产品X,还是糟糕的产品Y?”将快速引出反弹式回答,如“95%的费者会选择产品X!”
体育实况转播员的失误
体育实况转播员可以说是当今时代的巫医。他们会收集各种统计,概率以及情感,然后将其混合在一起而创造出一些糟糕的结果。如果你想看一些围绕着没有根据的结论的统计,你只要去观看一款足球比赛便可。
例如一个广播员会说“A队在最后5局游戏中并未阻止B队的进攻。”这种模糊的结论是关于A队不大可能阻止B队的进攻,而不是他们在最后5局游戏中成功阻拦了B队。但是你也可以反过来说——也许他们将会这么做,因为他们之前从未阻挡过任何对手。
但是事实却在于根本不存在足够的信息能够支持任何一种说法。也许这更多地取决于一种概率。阻挡进攻的机会是否就取决于一方在之前的游戏中是否这么做过?它们也许是两种相互独立事件,除非彼此间存在着互相影响的因素。
但是这并不是说所有体育运动的结论都存在着缺陷。就像对于棒球来说统计数据便非常重要。有时候统计分析也将影响着球的投射线或者击球点等元素。
最终还是取决于数据:当你拥有足够的数据时,你便能够获得更好的统计结论。棒球便能够提供各种数据:每一赛季大约会进行2百多场比赛。但是足球比赛的场次却相对地少了很多。所以我们最终所获得的误差也会较大。但是我并不会说统计对于足球来说一点用处都没有,只是我们很难去挖掘一些与背景相关的有用数据。
基于一些不相干元素做出总结
人们始终都在误解统计报表。比起使用对照关系,我们总是更容易推断出一些并不存在的深层次的关系。我最喜欢的一个例子便是著名的飞行面条怪物信仰(游戏邦注:是讽刺性的虚构宗教)的《Open Letter to the Kansas School Board》中的“海盗vs.全球变暖”图表:
venganza.org/about/open-letter/
我们是否能够开始解答问题了?
问题1的答案—-关卡时间
这一问题的答案很简单:你未能获得足够的信息去估算平均值。因为在1:24与2:32范围中波动的价值并不意味着它们的平均值就是2分钟。(单看这两个数值的平均值是1.97分钟,但是我们却不能忽视其它18个结果!)你必须掌握了所有的20个结果才能估算平均值,除此之外你还需要估算标准偏差值。
问题2的答案—-后续关卡时间
这时候你可能不会感到满足,因为标准偏差值过高了,超过平均值的40%。如此看来你的关卡中存在着过多变量。同时这里也存在着一些可利用的潜在元素,并且技能型玩家能够发挥其优势而造福自己。或者,你也可以严厉惩罚那些缺少技能的玩家。而作为游戏设计师,你最终需要做的便是判断这些结果(居于高度变量)是否符合预期要求。
问题2的答案—-标准偏差值
统计只是你所采用的一种方法,你同时还需要懂得如何进行游戏设计。如此,过于接近的计数分组使得我们总是能够获得一个较低的标准偏差值(500/52000=1%),这就意味着你所获得的分数几乎没有任何差别,也就是说在最终游戏结果中玩家的不同技能并不会起到任何影响作用。而当玩家发现自己技能的提高并不会影响游戏分数的发展时,便会选择退出游戏。
所以在这种情况下你更希望看到较高的标准偏差,如此游戏分数才能随着技能的提高而提高。
问题3的答案—-游戏时间
可以说这是一个很难获取的数值,不过它却说明了数据收集中的一个要点:你需要警惕那些看起来是错误的数据。就像0.2小时看起来就有问题。也许这是排印错误,或者是设备故障所造成的,谁知道呢。但是不管怎样在进行各种计算之前你都需要坚定不移地说服自己0.2小时是一个有效数据,或者你也可以选择将其丢弃而基于剩下的数据点进行估算。
其它有趣的内容
为了控制本文篇幅,我不得不略过许多有趣的主题。我只要在此强调理解统计不仅能够帮助你更好地进行游戏设计,同时也能够帮助你做出消费者决策,投票决策或者财政决策等。我敢下23.4%的赌注保证我所说的内容中至少有40%的内容是正确的。
对于设计师而言,统计能够帮助他们获取来自有记录的游戏过程(样本)的相关数据,并帮助他们为更大的未记录的游戏过程(人口统计)做出总结。
在实践中学习
例如在我刚完成的游戏中,我便是通过记录游戏过程的相关数据,并围绕着源自这些数据的平均值和标准偏差去设定游戏挑战关卡。我们将中等难度等同于平均值,较容易的等同于平均值减去一定量的标准偏差,而较困难的等同于平均值加上一定量的标准偏差。如果我们能够收集到尽可能多的数据,我们的统计便会越精准。
就像概率论一样,当你的项目范围变得越来越大时,统计也会变得越来越有帮助。很多时候你可以通过自己的方法进行摸索,而无需使用任何形式理论。但是随着游戏变大,用户群体的壮大以及预算的扩大,你便需要做好面对一个不平衡,且完全凭直觉的游戏设计中存在固有缺陷的准备。
关键词: 医学硕士;学位论文;数理统计;调查
摘 要:目的 分析医学硕士研究生学位论文中数理统计应用情况. 方法 随机抽取2000/2001年100位河南医科大学应届医学硕士学位论文初稿,对其中数理统计应用情况进行统计分析. 结果 论文中采用单因素设计者占94.0%,多因素设计占6.0%,应用正确率为96.6%;论文中使用经典基本数理统计方法为97.9%,统计学方法的正确应用率为75.7%;应用参数统计时出现的主要问题是未进行适用条件判断,而应用非参数统计时出现的主要问题则是推断结论有误. 结论 应加强硕士学位论文的数理统计设计和审查工作.
Keywords:medical master graduates;thesis;statistics;in-vestigation
Abstract:AIM Analysis case of using statistical theory in the thesis of2000~2001master graduates.METHODS 100thesis of this year’s medical master graduates in Henan Medi-cal University were taken out randomly.Their theoretical scores and practical application of health statistics in their thesis were analyzed.RESULTS Master graduate has grasped the theory of health statistics preferably.The abso-lute majority,namely97.9%of the total students,have used the basic statistic method in their thesis,75.7percent could use statistic method correctly.The main problem arising in using parametric test is that they hadn’t judged the applying condition,while in non-parametric test is that the conclusion is wrong.CONCLUSION Ought to strengthen checkup health statistical in the thesis of master graduates.
0 引言
数理统计的应用正确与否是论文科学性的重要标志.近年在医学学术期刊(包括国内著名的核心期刊)上发表的论著,数理统计方面还存在问题,甚至导出错误的结论[1-4] .数理统计作为一门应用学科已成为医学硕士研究生学位课程的主要内容之一,越来越受到硕士研究生的重视.为了解医学硕士生学位论文中数理统计的应用情况,为课题的统计设计和论文审查提供科学依据,为教学改革提供参考,作者随机抽取河南医科大学应届硕士学位论文100篇,对其数理统计应用情况进行分析.
1 材料和方法
2000/2001年河南医科大学共有医学硕士研究毕业生222人,应用随机数表随机抽取100名硕士研究生学位论文的初稿作为研究对象,对实验设计类型、使用的统计学分析方法及使用的统计学工具,存在的问题等进行调查.结果推断利用SAS(6.12)统计分析系统进行分析.
2 结果
2.1 实验设计类型 硕士学位论文中采用单因素设计的比重较大,占94.0%,统计学设计正确率较高(Tab1).
2.2 统计学方法 论文中使用经典的基本统计学方法的占绝对多数,为97.9%(856/874),统计学方法的正确应用率为75.7%,且不同的统计学方法之间的正确应用率存在着差别.应用参数统计方法者518次,应用正确者357次,正确应用率为68.9%;应用非参数统计方法者346次,应用正确者305次,正确应用率为88.1%.对参数统计方法的正确应用率低于非参数统计方法(χ2 =35.8,P
表1 硕士论文的实验设计类型及正确应用情况 略
表2 论文中应用的统计学方法分布及正确应用情况 略
表3 获取结果时使用的计算工具 略
2.3 数理统计问题 论文中存在的问题在参数统计与非参数统计中的构成不同,应用参数统计时出现的问题是未进行使用条件判断者159次,未正确应用统计方法者9次,推断结论有误者19次;而应用非参数统计时出现问题是未进行使用条件判断者8次,未正确应用统计方法者14次,推断结论有误者21次(两者相比χ2 =48.31,P
3 讨论
在硕士研究生的基础理论教学中,开设数理统计学的主要目的是为了指导研究生正确地应用统计学的原理与方法,解决医学研究中如何科学地进行科研资料的搜集、整理和分析推断问题.传统的经典的和基本的统计学理论与方法仍然是当前硕士研究生进 行科研工作的统计学方面的主要工具.论文中采用的完全随机、配对及配伍等单因素设计的比重较大占94.0%,多因素设计占的比重较少为6.0%,总的来说,其统计学设计的正确率是比较高的.说明学生对统计学设计理论比较重视并能正确应用.论文中使用经典的基本统计学方法占绝对多数为97.9%(856/874),主要为t检验、F检验、χ2 检验及秩和检验等,这与这些方法成熟、简单明了且实用性极强有很大关系,而近些年来新发展的比较前沿的统计学分析方法[5-12] ,由于对设计要求严格,使用过程复杂,非专业人员在短时间内难以掌握而实际应用较少.这提示在今后的研究生教学过程中,除应继续进行基础部分内容的学习外,还应加强新的统计学方法和使用条件的教学力度.
论文中以基本的经典的统计学方法为主,但实际应用时的正确应用率仅为75.7%,且不同的统计学方法之间的正确应用率存在着差别,对参数统计方法的正确应用率低于非参数统计方法.经进一步分析,应用参数统计时出现的主要问题是未进行适用条件判断,而应用非参数统计时出现的主要问题则是推断结论有误.作为一门应用学科,数理统计学有着其独特的逻辑性,概念多、公式多且连贯性强,众多的公式和分析方法既有联系又有区别,同时有着严格的适用条件.传统的教材编写和教学重点是统计学方法的计算技巧,其结果容易将学生引导到仅注重学习统计计算方法上,忽略了各种方法的适用条件和对资料的综合分析.所以t检验、F检验等经典的统计方法虽看似简单,但要正确应用到实际工作中,对学生来说仍有相当难度.秩和检验等非参数统计由于其适用条件较参数统计宽松,使得其正确应用率高于参数检验,而并非学生对非参数检验掌握的比参数检验更好.
随着计算机技术和统计软件的完善与普及,各种复杂的统计计算不必再用手工计算.本次研究表明大部分人(91.0%)通过应用著名的统计分析软件SPSS及SAS获取结果,这些结果比手工计算的更准确、更规范,所以各种统计方法的计算过程大可不必细致介绍,而要重点介绍各种数理统计方法的使用条件,加强资料分析实践,提高硕士生解决实际问题的能力.
参考文献
[1]Wang GS,Qian GS,Yang XJ,Huang CJ,Wei H.The statis-tics of application of laboratory animals in clinical research pa-pers in China [J].Di-san Junyi Daxue Xuebao(Acta Acad Med Militaris Tertiae),1997;19(2):163-165.
[2]Chen P,Zu SX.The analysis of statistical techniques used in the Chinese journal of clinical medicine [J].Anhui Yike Daxue Xue-bao(Acta Univ Med Anhui),1998;33(2):108-110.
[3]Fang JQ,Ling L,Zhang MR.Frequently appearing statistical mistakes in recent medical articles and relevant suggestions [J].Zhongshan Yike Daxue Xuebao(Acad J Sun Yat-sen Univ Med Sci),1999;20(4):314-318.
[4]Wang Q,Zhang BH.Current use of statistical methods in five core Chinese medical journals [J].Zhonghua Yixue Zazhi(Natl Med J China),1998;78(3):230-233.
[5]Zhang GK,Yao C,Xu YY.Contrast between two schools of thought on hypothesis test [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(2):85-87.
[6]Shang L,Xu YY,Hou RL,Zhang SP,Zhou YR,Chen CS.Comparison of different approaches of fitting centile curves for growth standard [J].Di-si Junyi Daxue Xuebao(J Fourth Mil Med Univ),2000;21(6):676-678.
[7]Li XS,Ni ZZ.On the problems of fitting linear regression mo-dels for hierachically structured data in medical research [J].Huaxi YikeDaxueXuebao(J WestChina Univ Med Sci),1999;30(1):59-62.
[8]Li XS,Zhang WT,Ni ZZ.Multilevel models in analysis of crossover design [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(5):273-275.
[9]Li XS,Liu QY,Ni ZZ.Meta analysis using multilevel models [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999:16(3):133-135.
[10]Sun XW,Fang JQ,Yang XF.Number-theoretic method for pa-rameters estimation in multivariate nonlinear regression with ap-plication [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(1):6-7.
1.统计学与管理的作用
统计在经济与管理领域的作用,主要表现在以下几个方面:一是能够反映社会发展的基本状况,通常反映的是国家或地区的资源状况、发展阶段、主要的经济成果等等指标;二是揭示了社会和经济发展的性质,通过分配关系和所有制关系的统计资料来说明;三是反映社会、经济现象的发展规律,比如两个现象间的依存关系、比例关系、结构变化以及因果关系。统计信息的充分利用,不仅能对事物本身进行定量和定性的分析,还可以针对不同事物之间的联系进行比较的分析,无论从纵向还是横向,统计学都有用武之地。
这些企业的营销管理中无处不渗透这统计学的知识。统计学作为收集信息、处理信息的一门科学,恰能在市场营销中的市场策划阶段的各个方面发挥科学决策的关键作用。
在市场营销活动中,要想做到策划准确,必须要广泛的收集信息,科学的处理信息,以便结果准确、决策科学。统计学作为一门收集信息、处理信息的科学,无论是在收集信息阶段的市场调查之调查问卷设计与调查样本的确定,还是在处理信息阶段的数据甄别和数据分析,都可起到十分重要的作用。在市场分析实际操作中,主要包括统计整理与统计分析。
2.统计分析
"统计分析"是将统计调查和统计整理的结果通过各种对比,通过动态数列,指数指标分析等方法进行深入的总结,分析。形象的显露事物变化的规律。从质的角度剖析事物数量的变动方向和变动程度。通过分析,与既定的指标指数相对照,从而得出内在联系或结论。以此为依据进行工作调整,达到统计的最终目的。在市场本文由收集整理营销之市场策划活动中,要想做到策划准确,必须要广泛的收集信息,科学的处理信息,以便结果准确、决策科学。统计学作为一门收集信息、处理信息的科学,无论是在收集信息阶段的市场调查之调查问卷设计与调查样本的确定,还是在处理信息阶段的数据甄别和数据分析,都可起到十分重要的作用。
3.当今的经济管理发展
当代的经济管理中,提倡以人为本的导向使管理方法进一步由定性向定量方向发展,而这一切都离不开统计方法的使用。根据我国的实际情况调查,我国税制的绿色化程度近年来是后退的,这就需要国家加大对生态经济的投入、对环境的保护也要加强。一个国家的经济发展和管理是件庞大的事情,国家也不可能把全部的调查报告放在一起查看,那么如何更清晰、直观的表达出很长一段时间内的经济情况,就需要统计学的加入。经济管理不是单一程序,这个过程中需要很多不同的因素来共同完成,统计经济学可以简洁、清楚的表达出经济的现况,统计分析也是统计学在经济中的一个很大作用。然而统计科学就它的实质来说,应该是应用数学的一个分支,并且可以认为是被应用于观察资料上的数学。同一公式可以同样地适用于绝对不同类型的具体对象,这是统计学的一个特征。经济应用统计学研究社会经济现象的数量特征和数量关系,必然要利用数学方法。
在经济管理中,经济现状的分析、随即现象的概率、每个变量 总体的影响等都与数学不可分割。把数学有的、严密性的特性结合到统计中,为经济管理提供论证和计量方法。运用好数学知识,在一定条件下,对大量事物的观察数据加以综合汇总、计算各种综合指标,从而较好的反映出现象的规律性,可以把管理工作做的更好。随着经济的发展,统计学将会在经济与管理方面发挥着十分重要的作用。无论是国民经济管理,还是企业管理以至于个人的生产、经营和决策,都要依赖于统计分析的应用。经济、管理类在现实中更注重于实际应用能力。在工作中通过列表、图示和加减乘除等初等方法对数据进行分析,可以对数据表达的总体有直观的了解,帮助人们解决问题。根据不同的位置,需要统计的事物也并不相同,所以我们也要灵活的运用统计学。
[关键词]应用统计学;课堂教学组织;方差分析
[中图分类号] G642 [文献标识码] A [文章编号] 2095-3437(2016)07-0103-02
随着新知识经济和网络时代的到来,笔者在教学科研的实践中,深切地感受到,无论是自然科学、社会科学领域的研究,还是国家宏观管理和企业生产经营管理,甚至人们的日常生活,信息需求量日益增多,信息处理技术更加复杂,作为信息技术支柱的统计方法,越来越广泛地应用于各个领域。[1] [2]应用统计学作为一门应用基础课,其内容丰富,应用广泛,几乎涉及自然科学和社会科学的各个领域。对于在校大学生,无论其学习什么专业,这门课程的重要性不言而喻。课堂教学组织是教师通过协调课堂内的各种教学因素以有效地实现预定教学目标的过程,积极探索应用统计学课堂教学组织有助于提高学生对统计理论与方法的掌握。
一、基本要求
要强调课程的重要性。统计学是研究不确定性现象数量规律性的一门学科。有关如何应用数理统计中的方差分析、回归分析、多重回归、过程控制等统计方法来解决实际问题,以及如何解决在实际应用中出现的统计计算的问题,对工程技术人员等实际工作人员来说是非常重要的。学生明白了该课程的重要性,也就认识到了学习的意义,自然就会认真对待这门课。
要培养良好的课堂习惯。在这一方面主要是通过辅导员课外开展学生工作、教师课上严格课堂纪律来规范群体行为,使学生能够做到“不迟到、不早退、不开机、不耳语、不走动、不堂食”,通过课程开始的提醒、过程中的坚持不懈,逐步形成“课上主动积极求学,课下活泼互助互动”的良好班级学习文化。
要建立规范的教学流程。为了使每次课堂教学活动都能达到教学目标,应对每一次课堂教学流程进行一定的规范,使每次课堂教学都包括前讲回顾、本讲教学、本课总结、作业布置等环节。
要开发学生的学习兴趣。为了使学生全身心投入课堂学习,除了规范的教学流程之外,还应采取教师讲授式、师生互动式、学生主导式等教学方法,提高学生学习的兴趣和参与的积极性,使学生在课堂中能快乐地学习。
要把控好课堂时间和教学内容。课堂的教学时间有限,教师必须在有限的时间内按教案完成既定教学内容。因此,教师必须突出教学重点,把握好教学节奏,严谨、圆满完成课堂教学。
要强调与计算机的结合。为着力提高学生运用统计方法分析解决问题的能力,教材所涉及的统计计算,要求学生学会运用目前已有的软件,如Excel、MINITAB等。尤其是MINITAB软件,它是专门的质量统计软件,一方面这一软件包括了几乎所有的统计方法和功能,另一方面掌握好这一软件对于后续质量管理与可靠性课程也非常有帮助。[3] [4]
二、前讲回顾
安排前讲回顾这一环节的目的,一方面是为了督促学生及时复习和巩固已学理论知识;另一方面是为了承上启下,在回顾前期理论知识的基础上引出本次课堂教学内容,使各次教学内容有连贯性和系统性。
为有效达到前讲回顾的目的,可以采用不同方法。如可以事先出好每一章的测试题,包含填空和选择题;也可以采用课堂上随机抽取同学回答教师的提问方式;还可以采用课堂随机提问与不定期测试相结合的方式。通过前讲回顾,可以让所有的学生检查一下自己的知识掌握情况,教师也可以通过学生的回答和测试情况了解教学效果。
三、本期内容教学
本期内容教学环节是每次课堂教学的主体环节。每次上课教学内容必然有所不同,但教学过程存在着一定的共性。下面以应用统计学中“方差分析”一章为例说明课堂教学过程。
(一)提出问题激发兴趣。兴趣是最好的老师,如果能够激发学生的学习兴趣,那么教学已经成功了一大半。笔者所在学院工业工程专业本届有四个班,大学扩招以来,高校对学生的管理非常重视,辅导员和教师都想了解不同班级之间有无差异,希望判断不同班级对课程的平均成绩是否有显著影响。这就是多总体的均值比较问题,对这类多个正态总体均值的检验,是否可以采用先前学过的逐一两两检验总体均值是否相等呢?答案是否定的。因为比较过程将更加复杂,同时还会导致判定结果犯第一类错误的概率大大增加。而这正是“方差分析”所要解决的问题。通过对四个班级成绩差异进行比较,激发了年轻的大学生们的竞争欲望和兴趣。
(二)讲授理论分析问题。在激发学生学习兴趣后,教师可以采用各种教学方式和方法,通过将这一实际问题抽象成为理论问题,来引导学生学习相应的理论知识。很多时候,学生之所以反感学理论,一方面是因为不了解理论来自于生产实践;另一方面是因为不知道这些理论在实践中如何运用或不知道其适用的情景,从而导致在实践中不会用或用错。因此,教师要讲清方差分析的理论观点、假设前提、运用方法。
(三)实践应用掌握知识。在讲授了方差分析所要掌握的理论及前提后,教师这时就要进一步结合第一阶段所提出的班级对成绩影响问题,运用第二阶段所讲授的方差分析理论与方法,进行相应问题的分析和解决。在这里一定要结合质量统计软件MINITAB[5],一方面提高运算效率,另一方面学生也要掌握MINITAB软件的功能。笔者在课堂上以第一阶段提出的四个班上学期八门课的平均成绩为例在课堂上做了运算,平均成绩数据如表1。把以上数据输入MINITAB统计软件,得出运算结果如表2
从输出结果来看,由于值=0.933>0.05,因此无法拒绝原假设。结论:四个班级的平均成绩没有显著差异,说明各水平间即四个班级之间并无显著差异。如果值
在课堂上并不需要细致讲解MINITAB软件的每一步骤,因为此时重点在于学生对方差分析理论的掌握以及引起学生对自身的思考,至于具体的操作步骤需要学生在统计学实验课上上机动手实践。通过这个例子让大家明白,对上学期八门课程平均成绩而言,班级之间并无统计学意义上显著差异。
实践证明,用这个例子学生能较容易掌握方差分析的理论方法,同时也有效调动了大家学习统计学的兴趣。
四、课堂教学注意事项
在主体内容的教学过程中,除根据教学大纲、教材和教案确定具体教学内容,注重教学环节和教学方法的运用外,为保证教学效果,还需要注意几点。
第一要突出教学重点。针对大学生的实际情况,教师不应该也不可能将所有的课程内容都纳入课堂教学中,所以在课堂教学过程中,要在系统展现该章知识体系的同时,突出重点教学内容。
第二要进行本讲总结。课堂教学效果并不取决教师讲了多少,而取决于学生学到了多少,因此课程内容宁少不要多,要讲透学透。因此,在每一次课堂教学结束时,要及时地组织学生进行总结,以感知每次的进步,反思依然存在的不足。通过总结,可加强学生对本次课堂教学内容的印象,从而为课下继续钻研和后续学习奠定良好的基础。
[ 注 释 ]
[1] 贾俊平编著.统计学(第四版)[M].北京:中国人民大学出版社,2013.
[2] 王庚,管于华,孙瑞博,陶用之编著.现代工业统计与质量管理[M].北京:中国人民大学出版社,2011.
[3] Douglas C. Montgomery, George C.Runger, Norma Faris Hubele著,代金,魏科萍译,张波校译.工程统计学[M].北京:中国人民大学出版社,2005.
关键词:市场经济;统计学;经济管理
中图分类号:F83
文献标识码:A
doi:10.19311/ki.16723198.2016.26.071
统计学主要应用于经济管理,在人力资源管理,财务管理等多个方面具有积极作用。其中,主要是用来反映经济发展的基本情况,通过统计可以使管理者正确掌握某一区域或者某一企业的发展状况与发展需求,从而制定合理的管理目标与管理方法。并且,统计学可以使企业的薪酬、人力分配更加合理。总之,其在经济发展中具有不可忽视的作用,而如何将其正确应用于市场经济中,还需要进一步的探讨。
1 统计学应用于企业市场营销
市场营销是企业获得利润的主要途径,在企业发展中,营销的核心问题就是分析市场需求,获得真实有效的营销策略。统计学中的因素分析与聚类分析等方法可以让管理者对市场进行正确的划分,并且统计特性还可以帮助企业获得最新的产品需求,以及合理的产品价格定位。统计学主要以信息的收集和处理为主,在市场营销的策划阶段,其作用不可忽视。
2 统计学应用于市场分析
市场分析核心为统计整理与统计分析。所谓统计整理就是对经济调查的相关数据进行整理和分类,最终通过对数据的分析来获得经济发展的趋势。统计学对于这一过程的数据科学分组以及最后的准确计算都具有积极作用。使复杂且大量的数据呈现出规律性,方便应用人员对其进行对比。通过对动态数据的分析,对经济发展进行质的剖析,从而显示出经济发展的基本规律,有利于经济市场的正确分析。在分析过程中,统计学通过既定的指标的对照来找到数据之间的联系,对企业决策中不合理的发展进行调整。
3 统计学应用于市场互动
对于市场营销的活动策划来说,要使其具有准确性,不但要进行信息的收集,还要注重于市场的互动。统计学以其广泛的理论覆盖了经济发展的多个方面,利用统计学,可以使样本的设计与调查更加精确与科学,使管理者在经济分析中能够及时正确的把握经济信息,从而实现与经济的互动采取与市场步调一致的发展策略,促进企业的可持续发展。在当下,经济发展处于新时期,如何用好统计学能够帮助企业走向时代的前沿,能够使管理者与决策者第一时间掌握最新的动态的市场信息。另外,对于国家对于企业的约束作用也十分明显,相关数据显示,在企业发展过程中,其多种因素是存在相互制约与共同发展转态下的,在不同的政策下,企业的税收、经济的投入方式是会发生变化的。统计学可以对相关数据进行分析,从而得出生态发展对于现代企业的重要性,督促企业实施改革与转型。
统计学的理论并不复杂,并且思路清晰,只有依赖于统计学,才能使政府和企业能够进行合理的、有效的调查,并且使调查结果更清晰。可见,统计学在经济管理中的重要作用,统计学作为数学的分支之一,可以应用于不同的领域,以及同一领域的不同方面,同一公式甚至可以应用于企业经济发展的不同方面。这与经济学的特点相吻合,经济学就是研究经济现象之间的数量关系,因此统计学的应用就成为一种必然。利用统计学的严谨。综合的特点,可以很好的反映经济现象与经济规律,促进经济管理的高效化。其具体过程为,在经济工作中通过简单的计算方式获得清晰的统计结果。在不同的统计事务中,科根据统计的目的来选择不同的统计方法。目前,在经济发展中,主要应用统计学的图表统计。数据统计等,主要应用于营销、顾客满意质素以及市场的基本需求上。以图表为例,在市场经济发展中存在着顾客满意度低或者是供大于求的现象,此时企业将处于销售危机。企业此时所做的统计不仅要包括市场方面,还要对其人力资源结构进行分析,包括对其经济的发展的多个影响要素的统计。例如通过统计图表,顾客不满意或供过于求时,那么企业收益会减少;人力资源管理中的统计。企业管理人员要对员工的满足度进行分析,从而了解员工的真实需求,减少企业在发展中的其他不利因素。
4 统计应用于审计
现代企业离不开审计,审计可以使企业发展更加规范,可以促进企业的发展。统计学应用于审计,主要体现在其样本统计上,审计具有轻重点之分,样本的重要程度是不同的,在这一过程中,要针对不同程度的概率进行分析,尤其是要注意其抽中概率。审计决定了企业发展的合理性,但审计相对复杂,不通过一定的手段很难直接发现企业经济数据中存在的问题。统计中的最优分层理论和最优样本容量分配理论都能够帮助审计,使审计的数据具有高准确性,从而更好的确保经济审计的进行,促进企业的发展。
5 总结
统计学是现代企业应用的重要理论之一,统计学主要是通过对企业经济现象,相关影响因素的数据整理、分析和处理,来实现通过现象看本质的目的。统计学不仅影响企业市场营销,还对企业的管理与决策具有积极的推动作用,因此对于企业来说,如何进一步认识统计的意义,并且正确应用统计理论是十分重要的。
参考文献