HI,欢迎来到学术之家股权代码  102064
0
首页 精品范文 多元统计分析

多元统计分析

时间:2023-06-06 09:29:59

开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇多元统计分析,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。

多元统计分析

第1篇

Abstract: Multivariate statistical analysis is a branch of statistics,which is rich and have a very wide range of applications. In many disciplines of natural and social sciences,researchers are likely to deal with data that has multiple variables. In this paper,we will discuss the concept,models and analytical steps of the factor analysis.

关键词:多元统计分析;因子分析;模型

Key words: multivariate statistical analysis;factor analysis;model

中图分类号:C93文献标识码:A文章编号:1006-4311(2010)15-0128-02

多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法。随着计算机应用技术的发展和科研生产的迫切需要,多元统计分析技术被广泛地应用于地质、气象、水文、医学、工业、农业和经济等许多领域,成为解决实际问题的有效方法。多元统计分析中的因子分析(Factor Analysis)是寻找公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。其基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的几个因子反映原资料的大部分信息,就是从大量的数据中“由表及里”、“去粗取精”,寻找影响或支配变量的多变量统计方法。

对因子分析模型可以做如下描述:①X=(x1,x2,…,xp)是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等。②F=(F1,F2,…,Fm)(m

称为因子分析模型,由于该模型是针对变量进行的,各因子又是正交的,所以也称为R型正交因子模型。

其矩阵形式为:x=AF+ep

我们把F称为X的公共因子或潜因子,矩阵A称为因子载荷矩阵,e称为X的特殊因子。A=a(ij),aij为因子载荷。数学上可以证明,因子载荷aij就是第i变量与第j因子的相关系数,反映了第i变量在第j因子上的重要性。

建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以便对实际问题进行分析。还有一个重要的作用是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价。

在上面的分析告一段落后,就可以确定因子分析的步骤。因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。

我们来看一个实际的例子,即考察我国各省市社会发展综合状况。

以下是对我国各省市综合发展情况做因子分析。数据表中选取了六个指标分别是:人均GDP(元)X1,新增固定资产(亿元)X2,城镇居民人均年可支配收入(元)X3,农村居民机家庭纯收入(元)X4,高等学校数量(所)X5,卫生机构数量(所)X6。原始数据见表1:

分析过程如下:①将原始数据标准化;②建立六个指标的相关系数阵R;③公因子方差;④总方差解建立因子载荷阵;⑤建立因子载荷阵;⑥对因子载荷阵施行方差最大旋转,旋转后得正交因子表矩阵,由此有:X1=0.947F1+0.178F2-0.115F3,X2=0.940F1+0.105F2+0.261F3,X3=0.893F1-0.0747F2+0.404F3,X4=0.0364F1+0.967F2+0.09455F3,X5=0.212F1+0.830F2+0.345F3,X6=0.222F1+0.493F2+0.806F3;⑦输出因子成份得分系数矩阵。最后,由上述表可见,每个因子只有少数几个指标的因子载荷较大,因此可根据上表分类,将6个指标按高载荷分成3类,列于表2:

由此,运用因子分析的方法我们对国内各省市综合发展情况有了一个了解。

由前面的分析可以得出,因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。

在实际问题中要选择适当的方法来解决问题,需要对问题进行综合考虑。应该根据实际情况对问题进行合理的分析与判断,收集相关资料,选择合适的分析方法,建立模型,最后对模型进行诊断和优化处理,并应用于生产实际。

参考文献:

第2篇

1通过教学环节培养实践能力

医用多元统计分析属于应用性的方法学科,课程性质要求学生在学习多元统计方法之后,要具备将各种多元统计分析方法应用到医疗卫生领域数据中的能力。培养学生的实践能力,仅从理论授课上下功夫提高学生实践能力是远远不够的,必须在理论授课、实验教学和课程考核等各个教学环节中都不脱离实践能力培养的主线。在理论课上讲授的内容一般包括原理方面的知识和如何分析实际数据两个方面。提高学生实践能力要求教学过程中淡化数学原理方面的知识,而将重点放置在如何分析实际数据上,即该多元统计分析方法使用的前提条件是什么,如何使用该方法以及分析结果如何解读,在具体研究的医学问题中此结果具有什么样的意义。尽管在现代教学方法中有体验式教学的渗入,但相对于实验课的实际体验来讲,学生对于数据何时采用、如何采用某种多元统计分析方法,还是保持在似乎知道,但又不完全明确的模糊阶段。很多原理方面的知识,尽管不是重点,但也需要学生了解一下,才能有助于把握整体脉络、合理应用,通过实验课的亲身体验,能直观观察到相对模糊的原理知识得到验证的过程,从而心服口服地从心底接受没有经过手工计算而呈现的分析结果。并且多元统计分析的实验课本身就是让学生去体验各多元统计分析方法怎样应用于实际数据的过程,从而使学生实践能力大大提高。一般课程考试比较侧重理论原理的考核,而医用多元统计分析授课的目的就是给学生讲授多元统计方法应用于医药卫生领域数据的实践过程,学习课程之后学生必须具备这种实践能力,否则就根本没有实现开设这门课程的初衷,没有达到教学目的。因此,课程考试也应侧重在学生实践能力的考核上。课程考核一般有试卷考核、平时实验成绩和上机考核三种形式,而以试卷考核的形式居多。对于医用多元统计分析课程,平时实验成绩考核和上机考核也应该是必须选择的考核形式,除此以外,在试卷考核中也可通过适当的题型体现对学生实践能力的考查。比如,将多元数据分析的结果展示在试卷上,让学生回答此分析结果对于研究目的反映出什么;或者指出研究目的,让学生回答选用何种多元统计分析方法,为何选用这种方法;或者从展现的结果让学生判断是否适用某种多元统计分析方法等多种题型来考查学生的实践能力。通过考核反馈出实践能力欠缺的部分,从而给予相应的应对措施。

2通过教学软件提高教学效率多元统计分析

建模一般都要经过逆矩阵、相关系数矩阵的计算,求解特征根与特征向量等过程,这些过程没有扎实的数学功底是根本不可能完成的。即便能完成这些运算,但也是相当耗时的过程。就运算相对简单的多元统计分析方法而言,如果采用人工计算器计算的话,也需要大约五个学时的时间才能完成,复杂的多元统计方法需要学时数就更多了。假定学校能够安排充分的学时数,学生也必须有足够的能力和耐心去完成这些运算。可见,统计软件和多元统计分析方法教学的结合是非常必要的。目前,常用的统计分析软件有SAS、SPSS和STATA。对于医学专业本科生和研究生的统计分析要求来讲,简单掌握每个软件基本功能就可以满足数据分析的需求,但对统计学专业的研究生而言,一般需要用到可编写程序的SAS软件,并且要深入学习,进行数据的模型拟合分析。各医学院校可根据自己的办学条件、师资力量、教材的情况、授课对象等因素综合考虑本院校采用医用多元统计分析的软件。借助软件在很短的时间能完成模型的建立、模型拟合检验等分析过程,通过分析结果中呈现的模型建立中间步骤,了解矩阵运算,求解特征根与特征向量的信息,把握前因后果、各步骤间的相互关系,大量时间的节余可用在多元统计分析方法的专业应用上。

3通过适宜教材激发学习兴趣多元统计分析

原理部分的繁琐复杂性对该课程的学习形成很大阻碍,且原理部分又不是医学专业学生学习的重点,这提示了教材选择的重要性。合适的教材不应该花费很大的篇幅在理论推导和模型建立的过程上,否则只会增加学生对该课程的畏惧心理。教材应当侧重于多元统计方法的应用部分,应用部分和学生专业的相关性越强,就越容易激发学生学习兴趣。上文中提到学习医用多元统计分析教学要结合统计分析软件,因此,教材中最好在每个多元统计方法的介绍之后都安排一个章节,说明这种多元统计方法通过统计分析软件如何实现,以及软件运行结果如何解读。医学各专业学生一般都未经过系统的统计软件的学习,因此,教材中软件相关内容的安排就尤其重要,不仅要有这样的章节,而且要通俗易懂,适合医学专业学生的初次统计软件学习,在每一种多元分析方法数据集的录入、软件实现的步骤、一些常用选择项的介绍、软件运行结果的每个部分的解读以及结合专业知识后的结论等各个方面都要有详尽的解释。医学可以划分成很多不同的专业,如公共卫生、医药和临床专业等,就公共卫生专业又可以进一步详细划分成劳动卫生、儿少卫生和营养等专业。目前的医用多元统计分析教材没有具体针对各个专业的多元统计分析教材,能选择到和医学专业接近的教材充其量也就是医用多元分析的教材了,因此,通过教材提高学习的积极性还是存在一定的局限性,但这种局限可以通过案例教学来弥补。在授课过程中,授课教师可能通过案例式教学,选择和授课学生专业休戚相关的例子来进行讲解,就格外能吸引学生的注意力。

4通过教学设计引导学生主动学习多媒体技术

在教学中的应用极大优化了教学过程。随着多媒体技术的发展,教学过程中“传统的PPT教学”逐渐形成新的多媒体教学形式——微课件。微课件是指使用多媒体技术在五分钟内就一个知识点进行针对性讲解的一段视频或音频。基于教学设计,微课件可用于难点讲解、内容小结等各个环节。如在教学导入阶段,教师根据新课知识点设计新颖的问题,通过简短的视频的形式展现。微课件以视频的形式吸引学生的注意力的同时,将教学问题引入,让学生带着问题去听完一堂课,从而起到引导学生主动学习、增强听课效果的作用。布置课后作业也是一种很好的引导学生主动学习的途径。以往教学中教师一般也布置作业,但布置的作业大多是多元分析方法基本思想和原则之类的思考题。笔者在教学实践中,将课后布置作业题目设定为“收集适用本次理论课医用多元分析方法的自己专业相关数据,并预计数据分析后可能的结果”。学生在收集数据的过程中,就必须去主动思考这种多元统计分析方法的基本思想、适用原则等问题,并且会进一步产生通过软件分析此数据的欲望。在实习课上,除了教师规定的实习题目之外,学生一般都会主动完成自己专业数据的分析,和教师探讨此数据分析的结果和对专业的指导意义。

5总结

以上是笔者在多年医用多元统计分析课程教学中的几点体会,通过培养实践能力、激发学习兴趣、提高教学效率和引导学生主动学习等多种方法增强教学效果,培养学生独立分析问题、利用科学方法解决问题的能力,使其在未来的科研岗位上能很好地利用和分析医疗卫生领域的海量信息为人们的健康服务。另一方面,通过各种方式增强医用多元统计分析的教学效果,也促使授课教师自身能力素质得以全面提升,真正落实“教师为主导,学生为主体”的教育理念。

作者:任艳峰 翟庆峰 王素珍 单位:潍坊医学院公共卫生学院副教授 潍坊医学院公共卫生学院

第3篇

辨证论治是中医防病治病的基本方法,抓住“辨证标准”这一关键环节开展研究,就有可能推动中医理论、临床疗效、证候本质研究的发展。作为中医学认识疾病和辨证论治的主要依据,症状及证候的规范化、客观化研究是带动中医药基础理论取得突破、促进中医药现代化的关键问题之一。然而,证候属于高维高阶的复杂系统,证候的高维高阶特性为证候的规范化、证候实质研究、证候诊断标准的建立等带来了困难[1]。随着生物信息学、系统生物学等研究的兴起,学术界越来越清楚地认识到,以信息系统视角研究同样是系统的、复杂的中医药理论体系,在合理整合和充分利用各种数据资源的基础上,进行科学分析、特征提取和规律探索,可能是研究中医学临床规律的一条可行的途径[2]。

1 多元统计分析方法在辨证论治研究中的优势

多元统计分析是数理统计学中近20多年来迅速发展的一个分支,它探讨高维数据的内在规律,如研究多元变量间的相互关系、数据结构和数据简化等。多元统计分析能综合体现出人体生命活动的特点和规律,与中医更有内在的切合性。中医药学理论中充满了数学语言和思维,如证的分类、组成和演变中饱含着多元模糊的数学思想,证候是以症状群组合的形式出现,但同时又受到许多因素的影响,证与症状的关系不是单纯的线性和正态的。中医证候的客观标准由某些特定的症状、舌象、脉象等“软指标”或定性指标构成,仅凭主观经验或文献资料进行辨证标准研究难免导致“选择性偏倚”和“测量性偏倚”,而较大地影响了证候标准的可靠性和准确性。将数理统计引入证的研究不但可行而且是科学的。

2 多元统计分析方法在辨证论治研究中的作用

2.1 用于症状的分类与筛选

症状是疾病所反映的现象,它是判断病种、辨别证候的重要依据,主要来自传统中医运用望、闻、问、切所获得的病情资料,多为宏观的、表面的、缺乏定量和定性的可检测指标,必然具有一定的不清晰性和随机性,易受假象和医者主观因素的影响。有专家指出,疾病的症状表现可大致分为三类,即:第一类代表疾病本身特征的症状,第二类代表证本身特征的症状,第三类对辨证辨病皆贡献不大的症状[3]。因此,如何从纷繁复杂的症状中筛选出属于中医证本身的主要症状,是认清证本身特点的前提。通过多元Logistic回归分析和因子分析等多元统计分析方法可以筛选出对证候辨证有决定意义的主要症状,如何运用Logistic回归分析某些变量(症状)对应变量(证)的不同“贡献率”来加以取舍,这对于甄别证的有意义症状是一种有效的方法,可以筛选出一些与该证有关的症状(群)。如张氏等[4]运用因子分析、C均值聚类和模糊综合评价对确诊为肝炎后肝硬化900例患者临床症状、体征等基本信息进行综合分析,提取该病的中医证候因子,得出结论:肝炎后肝硬化症状和体征信息经多元统计分析可划分为两大类,即疾病的共性特征信息和证候病机分类的特征信息。前者反映疾病所具有的中医基本病机,后者反映疾病的不同综合病理状态。

2.2 用于证的分类及危险度研究

证是机体在疾病发展过程中某一阶段的病理概括,反映出病变发展过程中某一阶段的病理变化的本质。疾病的证型会随着疾病的发展而变化,同一疾病的不同证型反映了疾病不同阶段的不同病机,也反映了疾病的轻重及危险性。当疾病表现出不同的证型时,其对健康的损害程度如何并不十分明了,所以,分析每一证型危险程度的大小就显得十分必要。如丁氏等[5]对375例胸痹心痛患者通过二值多元Logistic回归分析,比较不同证型的危险度。结果提示,胸痹心痛的危险证型按其影响程度依次由高到低为血瘀证、痰浊证、气虚证、阴虚证、寒凝证。另有顾氏等[6]通过系统聚类的指标分割法,根据聚类结果,发现肝炎后肝硬化的单元证有阴虚、肝胃不和、湿热、血热、肝郁/肝火、脾肾阳虚等6种类型,结合主成分因子分析法,前5个单元证发生率较高。证候是基于症状、体征、舌象、脉象反映出来,具有动态性、模糊性的特点,并通过对这些信息的综合分析、辨识而提取出来。采用临床流行病学调查,反复修正临床四诊信息调查表,运用多元统计方法提取特征信息,可为证候分类提供依据,进一步揭示中医证候的病机。

2.3 用于辨证分型及标准研究

“辨证分型”的基本形式是将西医或中医的某一疾病分为几个不同的证候类型进行治疗。通过“辨证分型”得出的证型虽是模型,却是在对患者群和症状群高度分析总结基础上对疾病过程的模拟,是建立在“病”的基础之上。而“疾病”是在病因的作用下出现的具有一定发展规律的演化过程,具体表现出若干特定的症状和各阶段的相应证候,是有规律可循的。因此,在病的基础上的证和证型也有规律可循,可以运用数理统计如多元分析等客观化的手段来探索其规律。如刘氏等[8]对乳腺癌术后患者进行聚类分析和主成分分析,结果显示,乳腺癌术后患者可以分为气虚、阴虚、肝郁、冲任失调及脾虚痰湿型。李氏等[8]采用多元统计方法分析焦虑症的中医症状、证型分布特征,将焦虑症的临床10余种证型简化为5种证型组合,以心脾两虚型最为多见,与临床观察实际基本符合。目前,临床上辨证分型的研究大多停留在对临床经验的总结上,辨证分型不统一,证名不规范,采用临床流行病学结合多元统计分析方法探索疾病的辨证分型及其标准是一个有益的补充。

2.4 用于证候危险因素的研究

证候作为疾病过程中阶段性的病理概括,影响因素常常涉及病因、病位、病程、病性、气候及患者的年龄、性别、体质等,虽然具有复杂而多变的特点,但其中仍有一些规律可循。如崔氏等[9]采用二元回归法对739例首发中风急性期患者的辨证分型单个和多个危险因素关系进行分析,结果高血压病、吸烟、饮酒分别为中风之肝阳暴亢、风火上扰证的危险因素,其它辨证分型与危险因素无统计学意义。另有专家认为,个体的体质是形成不同证的基础,故理清体质类型成为解答证型构成特点的钥匙,而中医体质、证候的分类、症状的组合可以通过聚类分析实现[10]。

2.5 用于证候的实质及辨证客观化研究

应用现代先进的实验方法与仪器,结合多元分析建立辨证诊断实验指标,是探究证候的实质、实现辨证客观化的必要手段。在研究证候的实质时,由临床检测到的生化、特殊检查指标或现代分子生物学指标等,可通过主成分分析和因子分析等方法进行分析,从而得出能真实反映某疾病证型规律的主成分。如温氏等[11]运用多元分析探讨IgA肾病的病理损害、临床表现及实验室检测指标与中医证型的关系,结果显示,IgA肾病的病理和临床表现与中医辨证相关联,阳虚证与水肿、阴虚证与尿血关系密切。王氏等[12]采用多元分析方法探讨血瘀证量化诊断的方法和血瘀证证候实质,通过对170例血瘀证与非血瘀证患者血红蛋白、三酰甘油、总胆固醇、内皮素、一氧化氮、纤溶酶原激活物6因素的逐步回归显示,其贡献度的顺序为内皮素>血红蛋白>纤溶酶原激活物>一氧化氮,三酰甘油及总胆固醇未能入选。对证候进行诊断客观化、标准化是辨证论治规范化的前提和基础,以症状、体征以及客观指标为立足点,以临床实践为准绳,综合运用多元统计分析的方法,并结合模糊数学评价,进行动态与定量研究,有利于进一步揭示中医证型的本质,实现中医证型的客观化。

2.6 用于证治规律研究

传统的辨证论治规律归纳和总结研究最大的弱点在于研究者无法通过定量方法来处理数据,往往主观加以选择、摒弃。采用多元统计分析方法可以较好地避免数据处理时掺杂的主观因素,客观准确地反映研究对象,并在文献资料中发现其内在的客观规律。通过文献整理与多元分析相结合的方法,探析中医病证的证治规律,重新审视中医学对病机属性、证治方案的认识,以此可揭示辨证论治的优势和特点。如卢氏等[13]通过多元统计分析方法,从方药的频数和剂量两个角度探求唐、宋、金、元、明、清各个历史时期治疗糖尿病的方药规律,得出补虚药、清热药是治疗此病的两类主要药物这一重要结论以及方药配伍关系,提示热盛伤阴、气血两虚应是历朝代总的糖尿病证候群的分型归属。丛氏等[14]通过总结中医历史上著名医家的医案建立大型数据库,采用非条件Logistic多元逐步回归法筛选变量,统计筛选出肺病的常见临床证候,与某一证候正相关和负相关的病因或病理结果、症状和用药,并定量地表达了这些病因或病理结果、症状及用药对该证候的重要性。多元统计方法适用于分析散在、庞杂的中医文献资料,有助于透过复杂的数字资料发现事物内在规律,已成为临床科研设计、分析和评估的主要手段和方法。

3 结语

辨证论治是中医几千年来防病治病的实践和理论沉淀,占据中医学诊疗体系的主导地位。中医药学研究的总体趋势是客观化、标准化和数量化,其中数量化是非常重要的环节。随着随机化实验设计和方差分析理论、方法,特别是SPSS和SAS统计软件在医学研究中的应用,使得辨证论治的研究方法由单纯的频数分析向多元回归、聚类分析、因子分析等多元统计分析方向过渡。近年来,许多学者采用多元分析方法应用于辨证论治客观化、标准化和数量化的研究,为中医药科研逐步从传统的以定性描述为主的方式向定量性描述过渡提供了一些有意义的探索。当然,在实践运用过程中还存在不少问题,如通过多元分析所得到的证型分类往往与传统中医辨证分型之间存在一定的差异,也提示今后如何将现代科学的多元分析方法与传统临床辨证论治经验相对接有待进一步研究。

【参考文献】

[1] 郭 蕾,张启明,王永炎,等.证候规范化研究的思路和方法探讨[J].中国中西医结合杂志,2006,26(3):258-261.

[2] 王永炎,刘保延,谢雁鸣.应用循证医学方法构建中医临床评价体系[J].中国中医基础医学杂志,2003,9(3):227-231.

[3] 梁茂新.中医证研究的困惑与对策[M].北京:人民卫生出版社,1998.6.

[4] 张 琴,刘 平,章浩伟,等.900例肝炎后肝硬化中医证候判别模式的研究[J].中国中西医结合杂志,2006,26(8):694-697.

[5] 丁邦晗,刘 涛,罗 翌.胸痹心痛危险证型的回归分析[J].中国中医急症,2004,13(4):225-227.

[6] 顾学兰,刘 平,陈家慧.肝炎后肝硬化单元证的多元统计分析[J].中国中医药信息杂志,2005,12(10):3-5.

[7] 刘 胜,孙 平,陆德铭,等.302例乳腺癌术后患者辨证分型标准的临床研究[J].中国医药学报,2004,9(11):666-668.

[8] 李 涛,杨春霞.焦虑症中医证候多元分析初步研究[J].中国中医基础医学杂志,2006,12(2):127-129.

[9] 崔晓琳,蔡业峰,卢 明,等.739例首发中风急性期辨证分型与危险因素关系的回顾性分析[J].中国中医急症,2005,14(10):974-976.

[10] 何裕民,王 莉,石凤亭,等.体质的聚类研究[J].中国中医基础医学杂志,1996,2(5):729.

[11] 温利辉,罗月中,洪钦国,等.IgA肾病中医辨证的多元分析[J].广州中医药大学学报,2006,23(4):290-294.

[12] 王 阶,李建生,姚魁武,等.血瘀证量化诊断及病证结合研究[J].中西医结合学报,2003,1(1):21-24.

第4篇

关键词:财务危机 预警 多元统计分析

一、 企业财务危机和多元统计分析

企业在经营过程中由于无力按时偿还到期的债务而产生的危机和困难就是企业的财务危机。一般来说,判别企业财务危机的常用标准是企业破产和证券交易中面临的退市现象。而企业是否能够生存下去的关键性因素正是如何正确处理好企业的财务危机。

多元统计分析是属于统计学中的一个重要分支,作为一种综合分析方法,能够在多个对象和指标相互关联的条件下分析其统计规律,“内容包括多元正态分布及其抽样分布、多元正态总体的均值向量和协方差阵的假设检验、多元方差分析、直线回归与相关、多元线性回归与相关(Ⅰ)和(Ⅱ)、主成分分析与因子分析、判别分析与聚类分析、Shannon信息量及其应用。”

    目前,由于我国的会计制度还存在一定的缺陷,时效性和精准性都还达不到要求,因而本文主要从企业由于现金流短缺,不足以支付所欠到期的债务而产生的财务危机的角度,利用多元统计分析的方式进行统计和分析。

二、多元分析的基本思路

据有关调查显示,现代经济市场行业类别的差异性导致了财务危机预警模型及参数的不同,所以需要采取不同的模型和方法来进行研究。运用多元统计分析方法进行多种变量模式的实证分析,从而提高了模型的针对性和可操作性。针对企业的多个财务指标,可以用聚类分析法进行统计分析,然后用判别分析法进行预测判别,最后用主成分分析法进行提取分析,根据最终的综合得分对样本进行适当排序,从而发现财务危机的状况,运用数据分析软件SPSS进行数据处理分析,建立企业财务危机预警模型。

三、 利用判别分析和主成分分析建立企业财务危机预警模型

第一,选择样本和变量选取。

在企业财务危机模型的建立过程中,首先要在企业中利用抽样方法进行选择。一般来说,可以选择随机抽样和对应样本法。

在企业中,选取“销售净利率、主营业务利润率、净资产收益率、资产净利率、每股收益( EPS) 、应收账款周转率、存货周转率、总资产周转率、营运资本总资产比、资产负债率、流动比率、现金负债总额比(债务保障率) 、现金流动负债比、现金流入流出比率、销售现金比率、每股净资产来建立指标体系作为分析变量……”等28 个指标是企业盈利、偿还等能力和资本实力的展现,也是交全面的反映企业的财务状况的指标,多变量模型的财务预警分析中,变量越多选择的余地越大,模型建立就越好。

第二,判别分析

根据样本和变量的选择,利用判别分析法建立企业财务危机的预警机制;同时根据判别分析法分析统计的研究对象分类,创建一组判别函数,确定好判别的规则,分类待判别的样本。

一般来说,用的Fisher 线性判别函数是判别分析中比较常见的。函数形式为: “Yi = a1 x 1 + a2 x 2 + ?+ an x n + b ( i =1 ,2 , ?, k) 。其中, k 是判别组数, Y 是判别分数或判别值; x1 , x2 , ?, x n 是因变量或预测变量; a1 , a2 ,?, anj 是各变量的系数,即判别系数; b 是函数中的常数。”

而判别函数的方式主要是全模型法和逐步选择法。全模型法是指函数中所有的变量都作为因变量,而逐步选择法是一种能反映变量子集的差异性的判别函数,利用逐步引入变量的方式,直至所有的变量都不符合模型的既定条件。

判别分析的基本步骤体现为:一、选择函数中的因变量、组变量;二、“计算各组单变量的描述统计量,包括组内平均值、组内标准差、总平均值、总标准差、各组协方差矩阵、组间相关矩阵,并对组间平均值相等及协方差矩阵相等的零假设进行检验”;三、建立Fisher 线性判别模型并进行判别分组;四、样本判别分析和验证分类的精准率,最后再输出结果,下结论。

第三,主成分分析

在企业财务危机中,除了判别分析模型的建立之外,主成分分析也是较为普遍的方式。首先可以通过验证筛选,选择需要建立模型的初选变量,且变量间存在一定的相关性。在变量较多的情况下,高维空间的研究样本通常都比较复杂,因此需要利用主成分分析方法实施第二次筛选,使得模型精简化。

主成分分析主要是分析企业财务危机数据信息中较为主要的变量,综合变量又能尽可能多的反映原来变量的信息,并且彼此之间互不相关的一种降维的多元统计方法。在企业财务危机分析中,具体是指,对企业收集的原始数据和财务指标进行标准化的处理,取平均为零,方差取1;然后,利用标准化的数据计算财务指标间相关系数矩阵R;最后,按其相关矩阵计算求解相关系数矩阵的特征值和特征向量、贡献率及累积贡献率。

实际上,企业的财务危机预警分析总的多元统计分析还包括其他比较常见的分析方法,本论文主要讨论了主成分分析法和判别分析法,利用变量之间的关系通过函数建立企业财务危机预警模型。

结 语

随着市场经济竞争地加剧和证券流通的全球化,原有的市场机制逐步暴露出弊端,出现企业机构投资者和控股股东相互博弈的局面,而这些弊端正是企业危机的潜在表现,如不加强对企业危机的有效控制,就有可能导致企业破产。因此,利用多元统计分析,提前预测企业的财务危机,建立有效的预警机制,对企业来说具有非常重要的意义。

参考文献:

[1]李杰  王蔚佳  刘兴智  .多元统计分析在企业财务危机预警中的应用[J].《重庆建筑大学学报》 2004年05期 ,2004

第5篇

关键词:方差分析;主成分分析;回归分析;红葡萄酒

中图分类号:O213文献标识码:A文章编号:0439-8114(2014)08-1867-03

Application of Multivariate Statistical Analysis in Assessing Red Wine Qualities

JI De-gang,CHEN Ya-ting,CHEN Jun-ying

(School of Science, Hebei Agricultural University, Baoding 071001, Hebei, China)

Abstract: 27 different red wine samples were evaluated by two groups of professional tasters (total of 20). The anova results showed that the second group was more credible. 13 main physicochemical indexes were defined as main factors affecting red wine qualities by principal components analysis of 16 indexes. A regression equation of the scores given by tasters was established. The test results showed that the equation had significant regression effects with squared correlation coefficient of 0.994 8, F-test of 15.908 6 and P value of 0.049 1.

Key words: anova; principal component analysis; regression analysis; red wine

随着经济的快速发展,人们生活质量的提高,红酒不再是少数人的奢侈品,它已经作为普通的消费品走进千家万户的餐桌。

随着红酒的普及,红酒的品质越来越引起大众的关注。那如何来鉴定葡萄酒的品质呢,一般情况下葡萄酒的品评都是借鉴美国著名的葡萄酒评论家罗伯特・帕克的100分制评分体系[1],聘请专业的品酒师来完成,这里完全凭借品酒师的经验,具有很强的主观性,而且对于一般人很难做到。本研究试图通过多元统计分析[2-4],给出葡萄酒品评的量化方法。一方面,可以为葡萄酒的生产及相关企业提供品评葡萄酒的可靠、稳定的量化评价方法;另一方面,为消费者在选择葡萄酒时提供简单易行的方法。

1数据来源

本研究中的数据均来自2012年全国大学生数学建模大赛A题的附件,其中包含两组评酒员(其中每组10人)分别从外观分析、香气分析、口感分析、平衡/整体评价4个方面10个子指标对27个样本的评分结果,以及27个样本葡萄酒中16个理化指标[5,6],包括花色苷、单宁、总酚、酒总黄酮、白藜芦醇、反式白藜芦醇苷、顺式白藜芦醇苷、反式白藜芦醇、顺式白藜芦醇、DPPH半抑制体积、L*(D65)、a*(D65)、b*(D65)、H(D65)、C(D65)、C(D65)等的测量数据。

为了方便地描述问题,引进以下符号:

1)xij为第i个红葡萄酒样本的第j个指标的数值(i=1,2,…,27;j=1,2,…,16)。

2)Xj,j=1,2,…,16分别表示葡萄酒中花色苷、单宁、总酚、酒总黄酮、白藜芦醇、反式白藜芦醇苷、顺式白藜芦醇苷、反式白藜芦醇、顺式白藜芦醇、DPPH半抑制体积、L*(D65)、a*(D65)、b*(D65)、H(D65)、C(D65)、C(D65)的含量。

2两组评酒员评价结果的可靠性分析

为了评价两组评酒员评价结果的可靠性,采用方差分析的办法,即分别计算每组评酒员对每个样品打分的均值和方差。如果每个评酒员在对样品作出评价时是客观公正的,那么每个人的评价结果与均值的偏离程度应该不大,也就是方差应该很小;反之,方差会很大。因此分别计算出每组评价结果的标准差数据如下:

第一组27个样品的结果:σ1=[0.93,1.30,0.88, 1.13,1.73,0.93…0.87,1.50,19.84]1×27

第二组27个样品的结果:σ2=[0.86,1.24, 0.97,1.08,1.69,0.94…0.88,1.41,0.63]1×27

由图1可知,第一组的评价结果的方差在很多点处很大,显然评价结果不可信。而第二组的评价结果的方差几乎分布在0的附近,说明第二组评酒员中每个评酒员的评价结果较客观公正,能够真实反映出27个葡萄酒样品的实际品质。

3影响葡萄酒品质的主成分分析

3.1主成分分析的原理

主成分分析是研究如何把存在相关关系的多个指标通过线性变换为少数几个相互独立的综合指标的统计分析方法,综合后的新指标称为原来指标的主成分或主分量[7-9]。

设有n个样品,每个样品观测m个指标,得到原始数据资料矩阵:

(X■1,X■,…,X■)=x■x■…x■x■x■…x■………x■x■…x■

式中,xji是第j个样品的第i个指标的观测值。

X■=x■x■…x■ x■x■…x■

式中,xni为第i个指标(变量)n个样品的观测向量。

用数据矩阵的个观测向量,作线性组合:

F■=a■X■+a■X■+…+a■X■

F■=a■X■+a■X■+…+a■X■

……

F■=a■X■+a■X■+…a■X■

要求满足:

1)a21i+a22i+…+a2mi,i=1,2,…,k;k≤m;

2)当i≠j时,Fi与Fj不相关,即Fi与Fj的协方差是0;

3)F1是X1,X2,…,Xm的一切线性组合中方差最大的,F2是与F1不相关的X1,X2,…,Xm的一切线性组合中方差最大的,…,Fi是与F1、F2、…、Fi-1不相关的X1,X2,…,Xm的一切线性组合中方差最大的,…,Fk是与F1、F2、…、Fk-1不相关的X1,X2,…,Xm的一切线性组合中方差最大的。

3.2主成分分析结果

由于16个指标的数据的量级和量纲据差异很大,因此首先对数据进行标准化处理。在这里数据标准化可采用将原始数据的各列除以各列的标准差,然后进行主成分分析。由图2可知,5个主成分的累积贡献率达到 88.98%,因此,重点分析前5个主成分。

从表1可以看出,在第一个主成分中X1、X2、X3、X4、X10的权重比较大,在第二主成分中X12、X15、X16的权重比较大,而在第三主成分中X13、X14的权重比较大,在第四主成分中X7、X11的权重比较大,在第五主成分中X8的权重比较大。综合分析影响葡萄酒的品质的主要因素有X1、X2、X3、X4、X7、X8、X10、X11、X12、X13、X14、X15、X16,将其作为评鉴葡萄酒的主要指标。

3.3二次回归分析

回归分析是能够通过数据处理建立变量之间的量化数学模型,可对问题的分析、判断、预测提供很好的帮助。

在本研究中,令y为葡萄酒的品质得分,以下建立y与Xj的二次回归方程。

y=b0+b1X1+b2X2+b3X3+b4X4+b5X7+b6X8+

b7X10+b8X11+b9X12+b10X13+b11X14+b12X15+b13X16

+b14X21+b15X22+b16X23+b17X24+b18X27+b19X28

+b20X210+b21X211+b22X212+b23X213+b24X214+b25X215+

b26X216+e

若令X=[1,X1,X2,X3,X4,X7,X8,X10,X11,X12,X13,X14,X15,X16,X21,X22,X23,X24,X27,X28,X210,X211,X212,X213,X214,X215,X216]

b=[b0,b1,b2,b3,b4,b5,b6,b7,b8,b10,b12,b13,b14,b15,b16,b17,b18,b19,b20,b21,b22,b23,b24,b25,b26]T

则回归方程可表示为

y=Xb+e

式中,e为随机误差。

以下为回归方程参数的估计:

采用Matlab 7.5 软件,可以得出

b=[213.05,0.07,1.94,5.18,3.86,1.17,44.20,108.00,

0.90,8.19,8.41,42.66,0.00,7.32,0.00,0.22,0.39,

0.24,0.70,26.47,168.40,0.01,39.02,38.85,2.70,

39.02,0.00]T

回归效果的显著性检验(α=0.05):

其中回归相关系数为0.994 8,回归方程的F=15.908 6,P=0.049。表明变量之间99.48%的信息能够由该方程来反映。

为了进一步讨论回归方程的回归效果,以下做了原始数据与回归预测数据的对比,由图3可以看出回归效果很好,可以用来评定葡萄酒的品质。

4小结

帕克的团队通过颜色和外观、香气、风味和收结、总体素质及潜力几个方面给葡萄酒打分。本研究通过分析帕克评分体系下葡萄酒的得分与各种有效成分的相关性,最终建立了由葡萄酒的16个主要理化指标与葡萄酒品质的回归方程,并检验了方程回归效果的显著性。通过给定回归方程能够简单、快捷地给出一种葡萄酒的品质得分,方便了葡萄酒的评定。惟一不足的地方是,葡萄酒的主要理化指标[10]还要一些特定的方法去测量,以后可以考虑各指标的简单测量方法。

参考文献:

[1]王麟,陈辉.葡萄酒投资价值与策略分析[D].上海:上海交通大学,2012.

[2]姜起源,谢金星,叶俊.数学模型[M].第四版.北京:高等教育出版社,2011.

[3]苏金明,张莲花.刘波.Matlab工具箱应用[M].北京:电子工业出版社,2004.

[4]于秀林,任雪松.多元统计分析[M].北京:中国统计出版社,2006.

[5]蔺红苹,邱翠婵,刘嘉玲.自酿葡萄酒的卫生指标和理化指标的检测[J].湛江师范学院学报,2010(3):98-102.

[6]张琳.傅立叶变换红外光谱法快速测定葡萄酒理化指标[D].广州:暨南大学,2012.

[7]何少芳,李梦祝.SPSS软件在葡萄与葡萄酒理化指标的相关性分析中的应用[J].长沙大学学报,2012(5):11-14.

[8]彭德华.影响葡萄酒质量的主要因素分析[J].中外葡萄与葡萄酒,2004(5):40-44.

第6篇

一、多元统计分析评价企业经济效益的必然性

我国自20世纪80年代开始评价企业经济效益,当时针对国有企业的两权分离的特点,特别制定了企业经济效益评价的十大指标体系,并在2002年进行了修改,综合考虑了企业投资人、债权人和社会效益三个方面。虽然此评价体系是根据新财务会计准则进行的调整,但仍存在一些不足之处,过于注重财务指标(总资产报酬率等8个指标),忽视了企业市场竞争力的非财务指标(市场占有率、存货周转率)。有些指标间有交叉或是关联,致使评价体系有一定的局限性,很难客观、全面地评价企业效益。假如资产负债率低的企业,它的自有资本高,同时如果净利润相当,那么它的资本收益率反而比资产负债率高的企业还要低。基于上述的情况和问题,全面考虑到企业市场竞争能力、企业财务能力、经营管理水平和企业发展能力,建立多元化企业经济效益评价体系,主要从获取利润的能力、开展资产运营能力、参与竞争的能力、经营管理能力和企业发展能力对企业经济效益进行全面系统评估。

二、多元统计分析在企业经济效益评价中的应用

统计学的不断发展为企业经济效益评价提供了支持,评价企业经济效益开始采用多元统计分析方法,它可以把多维度问题映射到单一维度,然后通过模糊决策、加权平均等方法全面地反映企业经济效益。在企业经济效益评价中应用较多的多元统计分析方法如下:

(一)主成分分析方法

所谓主成分分析是将具有多个相关的指标转换成新的相互独立的指标的一种多元统计分析方法。这种方法可以消除各指标间的相关性,以尽可能小的数据损失,反映尽可能多的指标,客观地描述样本的相对地位,减少主观的评价结果。利用主成分分析方法评价企业经济效益中,在评价企业的资产运营能力时,可以将多项的财务指标(总资产报酬率等8个指标)重新组合、分解,形成生产经营成果指标、资金利用效率和消耗资源指标三个新的相对独立的指标,然后将三个指标通过杜邦分析图进行分析即可。

(二)因子分析方法

因子分析方法可以看作是主成分分析方法的推广,也是企业经济效益评价较为常用的方法之一。因子分析方法能够将多个具有较复杂的关系的指标归纳为主要的少数几个指标的统计方法。此方法以多指标之间的相互关系为基础并加以组合,形成最少个数的独立新变量(因子),简化变量并能够避免不同变量权重设计的误差。例如评价企业经济效益时,可以将固定资产税率、资金利税率、销售收入利税率、资金利润率、固定资产产值率、流动资金周转天数、万元产值能耗、全员劳动生产率等综合为盈利能力(固定资产税率、资金利税率、销售收入利税率、资金利润率、固定资产产值率)、资金和人力利用因子(流动资金周转天数和全员劳动生产率)、产值能耗(万元产值能耗)三个因子作为考核企业经济效益的指标。

(三)聚类分析方法

聚类分析是将研究对象、数据进行分类的分析方法。首先根据研究对象的相似性来分类,按照一定的原则将相似元素归为一类,然后再将相似的样本进行合并,直到所有样本都归为一类。在企业经济效益评价中,可以将资产周转率、利息倍数、流动比率、应收账款周转率、速动比例、偿债比率、存货周转率等利用聚类分析方法将其归为企业资产运营能力进行评价。

(四)判别分析方法

与其他统计方法不同,判别分析是在分类确定的条件下,即事先已经知道了判别的规则和类型,在分析未知样品类型是,只需要遵循判别规则进行样品分类的多元分析方法。在进行企业综合效益分析时,如已经明确了资产运营能力的指标体系,只需要对指标进行加权分类,就可以判定不同企业资产运营能力的强弱。判别标准不同时,常用的判别方法是Fisher判别;按函数的形式,一般用线性判别。判别的方法可分为很多种,要结合企业的实际情况和评价指标,选择最能反映企业效益的判别方法。

三、多元统计分析评价企业经济效益的前景

由于多元统计分析方法是研究多个随机变量之间相互关系及内在规律的一门统计学科,应用到企业经济效益评价中,简化了错综复杂的评价指标,更加客观、全面、系统地反映企业经济活动效率。可以真实、完整地对企业在一定期间的经济效果进行判别,并确定企业经济效益的现状。多元统计分析方法还可以有针对性对企业资本运营效率、资源利用率等分项进行评价,提高劳动生产率和经济效益。我们可以通过对企业经济效益的多方面评价,寻找和挖掘企业的可利用潜力并预测企业发展的前景,促进企业经济效益和社会效益的提高。

第7篇

[关键词]上市银行;聚类分析;判别分析;主成分分析

1数据来源及模型假设

文章选取 16 家上市银行为研究对象,对其2016年第三季度财务报表进行整理分析,获得所需数据。为了便于解决和研究问题,提出以下几条假设:①假设16 家上市银行的年报真实可信;②假设上市银行在编制年报时使用会计记账方式等一致;③假设设置的变量取值都有实际意义且数据记录准确规范。

2数据指标的构建

文章从公司规模、盈利能力、偿还能力、成长能力、营运能力五个方面选取19个量化指标,分别为基本每股收益、主营业务收入、主营业务利润、营业利润、投资收益、利润总额、净利润、经营活动产生的现金流量净额、总资产、总负债、股东权益(不含少数股东权益)、净资产收益率加权、净资产收益率、净资产报酬率、非主营比重、净利润增长率、资产的经营现金流量回报率、经营现金净流量与净利润比率、经营现金净流量对负债比率。

3聚类分析

31变量分类

第一类中的五个指标是对银行收益进行刻画的指标:第二类中的八个指标是对利润、资产、负债和所有者权益的表现;第三类的两个指标是对银行其他业务的收入的刻画;第四类的四个指标是对银行现金流量的反映。

32样品分类

通过最远邻元素、Ward法和K-均值聚类法三种分类结果比较,民生银行、南京银行、宁波银行分类结果不一致,因而采用判别分析继续研究。

4判别分析

判别分析选用方法:贝叶斯判别。根据分类函数系数表可以得出三组判别函数的表达式。

将各银行数据进行回判结果如下。

回判结果表明:总的回代判对率为100%。待判银行:民生银行、南京银行、宁波银行,其判别结果如下:

民生银行、南京银行属于第二类,宁波银行属于第一类。

5主成分分析

51主成分分析过程

(1)将原始数据标准化。

(2)建立变量的相关系数阵。

(3)求相关系数阵的特征根和相应的单位特征向量。

(4)主成分函数。

在第一主成分表达式中,主营业务收入、主营业务利润、营业利润、利润总额、净利润、总资产、总负债、股东权益(不含少数股东权益)的系数较大,这八个指标起主要作用,可以把第一主成分看作收入、利润、资产、负债、所有者权益的银行总体规模的综合指标。同理,可以把第二主成分看作银行营运能力的指标,把第三主成分看作利润成长能力的指标,把第四主成分看作非主营业务收入能力的指标。

52样品主成分得分结果

综合排名前四名是建设银行、工商银行、农业银行和中国银行,对应聚类分析结果的第三类。国有的四大银行在总体规模、营运能力、利润成长能力、非主营收入能力四方面的综合能力都有着显著的优势。

在y行总体规模方面,四大国有银行的总体规模比较是:工商银行>建设银行>农业银行>中国银行。在银行营运能力方面,建设银行>农业银行>工商银行>中国银行,说明建设银行和农业银行的运转出色。在利润成长能力方面,建设银行>工商银行>农业银行>中国银行,建设银行实现了较高的利润水平。在非主营收入能力方面,中国银行>建设银行>农业银行>工商银行,中国银行和建设银行优化了收入结构,中间业务收入占总收入的比重加大,拓宽了利润空间。

综合排名在第五名到第十一名的银行均是在2016年第三季度业绩优良的商业银行。利用同样的分析方法得出:在银行总体规模方面,民生银行与交通银行的总体实力较强。在银行营运能力方面,民生银行与宁波银行的营运能力较好。在利润成长能力方面,招商银行与浦发银行的利润成长能力较强。在非主营收入方面,民生银行与宁波银行的中间收入较高,突破了传统收入的局限,拓宽了利润渠道。总体来讲,这七家银行各有各的优势,也各有各的不足,水平相当。

剩余五家银行:平安银行、华夏银行、北京银行、南京银行、光大银行总体业绩较差,总体规模较小,营运能力较差,没有自己突出的优势,因此整体业绩落后于其他银行。

第8篇

【关键词】城市交通运输;逐步线性回归;系统聚类分析

1.引言

城市作为政治、经济、文化中心,在国家发展中发挥着重要作用。20世纪80年代开始,学者开展了一系列对中国城市的研究,如提出中国的城市影响域系统,并评价中国城市的影响力。根据因子分析方法,对中国城市进行综合实力的评价,建立综合评价体系,分析中国地级以上城市综合竞争力,以及中国城市人口可比增长速度的空间差异。根据城市网络图探讨新城在城市网络中的作用以及城市网络对新城发展的影响;运用层次分析和多指标加权法对中国城市科教职能进行等级划分及空间分布研究。

国外关于城市交通运输的研究集中在城市交通运输与城市空间、居民出行、城市交通问题及其相关政策等方面,区域中的城市交通运输研究主要是城际问的客货流变化等问题,以及城市交通运输结构变化引发的交通运输问题,例如对尼日利亚、捷克斯洛伐克、印度、巴西、英国等国家的研究;Sylvie选取中国24个省区为基本分析单元,以铁路、公路和水运路网的密度为指标,研究中国省际交通网络发展水平的差异,结果表明交通网络密度较高的省份集中于东部沿海地区,西部地区则较低上述分析基本上是以城市的总体发展或者以人口和土地等要素为主来进行的,在分析中也涉及到了城市交通运输的一些方面。

本文研究的城市交通运输既包括城市对外交通运输发展,也包括城市内部交通运输发展两个部分。城市交通运输发展水平主要表现为城市交通设施的发展和运输能力,主要包括道路面积和车辆、客运量和货运量等。本文在总结上述研究经验的基础上,主要根据城市在城市体系、区域及国家发展中的重要性,资料信息的完备性、可比性及其获取的可能性,确定以2010年的279个地级以上城市的城市交通运输为研究对象和评价目标。

2.指标选取

在前人研究的基础上,本文将影响城市交通运输的因素归结为:货运总量、客运总量、城市GDP、城市产业结构、城市人口、城市道路面积、城市汽(电)车营运数量、城市出租车数量等。鉴于数据获取的有限性和分析的可靠性,本文选取客运总量、货运总量、城市GDP、城市产业结构中的第二产业占GDP中的比重以及第三产业占GDP中的比重、城市人口、城市道路面积、城市汽(电)车营运数量和城市出租车数量9个指标作为研究城市交通运输的影响因素。

(1)客运、货运总量

客运和货运总量是衡量一个城市对内对外交通运输发展的总量指标,通过这个指标可以得出一个城市的城市交通运输发展状况,它包括城市铁路运输量、公路运输量、水路运输量、航空运输量等。

(2)城市GDP

即城市市辖区内年生产总值,是衡量一个城市经济发展水平的最重要指标,GDP总量大意味着经济发展水平高。

(3)城市产业结构

城市社会再生产过程中形成的各产业之间及其内部各行业之间的比例关系和结合状况,由于各个城市的自然条件和社会经济条件不同,引起国民经济部门配置和发展规模不同,因而不同城市的转出产业的差别较大。就城市本身而言,第二产业占GDP的比重越高表明城市工业和制造业越发达;而第三产业占GDP的比重越高表明城市服务水平越高。

(4)城市人口

衡量一个城市社会发展水平的指标,一般情况下城市人口越多,表明这个城市对于人口的吸引力越强,城市的社会发展水平越高。

(5)城市道路面积

城市道路面积对一个城市来说极其重要,是衡量一个城市发展的重要指标。

(6)城市汽(电)车营运数量

城市汽(电)车是城市居民主要的出行交通工具,是城市公共交通最主要的衡量指标。

(7)城市出租车数量

城市车租车也是城市居民较为主要的出行交通工具,但其价格比汽(电)车昂贵。城市出租车数量也是城市公共交通最主要的衡量指标。

将以上指标假设如表1。

本文研究分析我国地级以上281个城市2010年城市交通运输的多元回归分析和系统聚类分析,其数据来源于2011年《中国统计城市统计年鉴》。

3.城市交通运输多元回归分析

城市交通运输发展水平与城市经济发展、城市社会发展以及城市交通基础设施规模是否存在线性关系,下面分别通过逐步回归的方法建立城市客运总量与假设的其余指标之间的线性函数,城市货运总量与假设的其余指标之间的线性函数,旨在通过建立函数揭示城市交通运输发展的影响因素和预测未来城市交通运输的发展趋势。

3.1 以城市客运总量为因变量的逐步回归分析

将客运总量与GDP(当年价格万元)、第二产业占GDP中的比重(市辖区)、第三产业占GDP中的比重(市辖区)、城市市辖区人口(万人)、城市道路面积(万平方米)、城市公共汽(电)车营运数量(量)和城市出租车数量(量)输入统计软件SPSS中,以客运总量为因变量,其他的为自变量,得出如下表2结果:

注:逐步回归进入的自变量为X8, X9, X9, X3, X7;因变量为X1

第9篇

>> 档案工作“有法必依”期刊文献计量统计分析 档案管理体制研究的文献计量统计分析 多元统计分析法在中药研究中的应用及前景 基于文献计量法的国内档案知识管理研究分析(2000年~2012年) 基于文献计量法的彝族文化研究现状分析 浅谈统计分析法在企业中的应用 《科技与经济》文献计量与研究热点统计分析 2006-2011年比较方法在我国档案学研究中的应用统计分析 基于CiteSpace文献计量法的石墨烯研究文献可视化图谱分析 文献计量法分析我国针刺穴位研究的现状及发展趋势 文献计量法对近六年我国自动标引研究的分析 多元统计分析中的因子分析法的应用 数字(化)档案室文献计量统计分析 证券投资中多元统计分析法的应用研究 数据统计分析法在市场调查中的对比探析 我国中小学图书馆研究:基于文献计量学的统计分析 档案法操作性相关研究文献统计分析  对我国档案学核心期刊电子文件保护研究论文的统计分析 《中国学校卫生》杂志2008年文献计量学统计分析 《档案法》“软法”说文献统计分析 常见问题解答 当前所在位置:.

[2]肖彦花.统计学理论与方法[M].长沙:国防科技大学出版社,2005:4-5.

[3]邱均平.文献计量学[M].北京:科学技术文献出版社,1988:2.

[4]何晓群.现代统计分析方法与应用[M].北京:中国人民大学出版社,2012:5.

[5]邱均平.文献计量学[M].北京:科学技术文献出版社,1988:20.

[6]袁山.统计分析工具在历史研究中的应用[J].中国青年政治学院学报,2002(4):88-93.

[7]邱均平,王曰芬等.文献计量内容分析法[M].北京:国家图书馆出版社,2008:157-158.

[8]丁牧羊,王Q淇.《周礼》文档名词再研究[J].档案学通讯,2015(6):32-39.

[9]李,胡燕.影响公众档案利用行为的个体特征因素分析――基于苏州市居民的调查[J].档案学研究,2015(4):94-100.

第10篇

建立多元化企业经济效益评价体系不仅要考虑企业财务能力,还有综合考虑企业市场竞争能力、经营管理水平和企业发展能力。可以从五个方面综合评价企业经济效益:一是获取利润的能力,包括资产利润率、资本收益率和成本费用收益率;二是参与竞争的能力,包括产品销售增长率、订货合同履约率;三是开展资产运营能力,包括资产周转率、偿债比率、不良资产比率;四是经营管理能力,包括企业领导决策水平、职工积极性和凝聚力、企业内部协调控制能力、激励约束机制;五是企业发展能力,包括企业自我积累比率、技术创新能力、人力资源质量。这五大类指标构成多元化企业经济效益评价体系,要结合定性评价和定量评价对企业经济效益进行全面系统评估。

二、多元统计分析在企业经济效益评价中的应用

多元统计分析为综合评价企业经济效益提供了重要的工具,使用多元统计分析可以把多维度的复杂问题映射到单一维度,再通过加权平均、模糊决策综合评价法等技术方法反映企业经济效益全面,得到一致性、综合性的评价结果。本文重点研究四种常用的多元统计分析方法在企业经济效益评价中的应用。

(一)聚类分析

聚类分析也称为群分析,是一种基于数据分类的分析方法,它的核心是将相似元素集合为一类,然后根据样本间的相似程度合并,依次合并减少分类,直到所有样本都合并为一类为止。在企业经济效益评价中,需要对企业的资产运营能力进行评价,可以使用的指标包括资产周转率、应收账款周转率、存货周转率、偿债比率、利息倍数、流动比率、速动比例等等,因此首先要对这些指标利用聚类分析方法进行分类,得到关于企业资产运营能力的整体评价。

(二)判别分析

判别分析也是一种分类分析,与聚类分析不同,判别分析是已知样本类型和判别规则,然后对未知类型的样品进行判别分析的多元分析方法。例如已经确定资产运营能力的指标体系,并指定指标间权重,就可以判定企业资产运营能力的强弱或者划分资产运营能力等次。最常使用的是Fisher线性判别函数,在行业或地区样本判别分析的基础上,计算出函数分类的准确率,并结合研究企业的实际情况就可以做出比较结论。

(三)主成分分析

主成分分析将具有一定相关性的原来指标重新组合、分解,形成一组新的无关联的综合指标,以尽可能小的数据损失,反映尽可能多的指标信息。在企业经济效益评价中主成分分析可以将复杂的数据指标综合成几个无相互关联的指标,例如评价企业资产运营能力可以使用的财务指标很多,要将这些指标重新划分为生产经营成果指标、消耗资源指标和资金利用效率指标,利用杜邦分析图,得到企业资产运营能力的综合评价。

(四)因子分析

因子分析是主成分分析的推广,它的区别在于能够将随机的错综复杂的变量综合为主要的少数几个变量,并以有限数量的变量(或因子)反映原始数据的内在结构,减少了数据丢失,使评价分析更接近数据本身。例如企业经济效益评价内容广泛,从企业营销到员工激励无所不包,但是应用因子分析可以概括为五个方面,例如获取利润的能力、参与竞争的能力、开展资产运营能力、经营管理能力和企业发展能力等等。这种数据处理不仅减少分析变量的数目,而且避免不同变量权重设计的误差。

三、结束语

第11篇

多元统计分析是同时分析和处理多组变量,从整体把握事件的特征和发生规律统计分析方法,其核心内容是总体参数估计的修正和统计推断,具体表现出来就是各类统计方法,如主成分分析、因子分析、聚类分析、判别分析和典型相关分析等•。多元统计分析应用于中药质量控制的研究有以下几种优势:①多指标性只有用相互关联的多个指标(即描述现象的多个方面)才能够对事物或现象的全貌有所了解,这是多元统计分析在中药质控研究多个指标的最大优点;②定量性多元统计分析就是用数学的方法来研究影响中药质量的多个指标之间相互依赖关系以及内在统计规律性的分析方法;③复杂性和数据计算量大等特点这是多元统计分析适宜于分析研究中药质控中出现的繁琐复杂数据的基础。

2多元统计方法在中药质量控制中的应用现状

多元统计分析广泛应用于经济管理、医学、教育、生物等诸多领域,其中以中医药为检索范围,在已检索到的运用各类统计方法的51792篇文献中,包括多元统计方法的文献已达25279篇,说明多元统计方法已在中医药研究中得到了广泛应用。而统计学理论和中医药理论客观存在的相合性,也说明了多元统计方法在中医药研究中的应用不仅是可行的,也是科学的。运用多元统计分析对影响中药质量的多方面因素进行综合分析和评价,以实现对中药质量更准确,更全面地控制。下面分别介绍几种主要的多元统计分析方法近年来在中药质控中的应用。

2.1主成分分析主成分分析的定义为利用数学降维方法,寻找新变量替代旧变量群,新变量之间互不干涉,可独立进行分布统计,是一种将多数相关变量群替换成少数无关变量的方法。主成分分析法能过滤虚假信息,减少无关指标的影响,已普遍应用于中药质量标准研究数据的统计分析中,以确定中药资源的分类和聚类,并从中获取能用于中药分析鉴别的有用信息,然后进行分析、鉴别、判断,进而进行分类和优选。王劭华等采用主成分分析对24批不同产地车前子样品中的10个共有峰面积进行分析,以累计方差贡献率达86.45%选取3个主成分,由主成分综合得分排序可知,综合品质较好的车前子品种为大车前子和平车前子,其中综合品质最好的为江西吉水婆婆庙产的大车前子;根据车前子主成分投影图可以将车前和平车前种子与其他品种车前种子区分开来。王琴等应用主成分分析对不同地区枸杞中多糖和金属元素之间的相关性进行分析,以累积方差贡献率达88.181%筛选出3个主成分,结果表明多糖和常量金属元素钙(Ca),镁(Mg),钠(Na),钾(K)是影响枸杞质量的重要因素,微量元素铜(Cu),锌(Zn),铁(Fe)也是不可忽视的因素;其主成分得分可用于不同产地枸杞子质量的综合评价,为以后不同产地枸杞的开发利用奠定了基础。

2.2因子分析因子分析又称为探索性因素分析,是根据相关性大小把原始变量进行分组,使同组内变量之间的相关性较高,而不同组变量间的相关性较低。因子分析也是利用主成分分析的降维思想,可看作是对主成分分析的推广和发展,但是其因子分析对于所研究的问题是根据原始变量的信息进行重新组合,以试图用最少个数的不可测的所谓公共因子的线性函数和通过旋转使得来的新变量对每个原始变量更具有可解释性。朵兴红采用因子分析对党参、细辛等7种道地药材中Ca,Mg,锰(Mn),Cu,Fe,Zn6种微量元素进行分析,以方差的贡献率大于99.75%提取2个主因子,分析结果表明这6种微量元素均对防治心脑血管疾病有一定的疗效,为微量元素与中药功效关系的研究提供了科学依据。多杰扎西等采用因子分析对11个不同产地枸杞子中Zn,Cu,Fe,Mn等微量元素之间的关系进行研究,以累计方差达92.236%提取3个主因子,结果表明第一主因子与变量Zn和Mn有高的相关性,是枸杞子中起络合作用的微量元素,也是决定枸杞子质量的基本微量元素;第二主因子在变量Cu元素上有最高的载荷系数,是通过影响生物体内的酶、激素、维生素等生物活性物质,而发挥药效作用的微量元素;第三主因子在Fe元素上有最高的载荷系数,是在氧化还原等许多代谢中起到重要作用的微量元素,这3个主因子能够反映枸杞子中微量元素的分布特征;不同产地枸杞子的综合评价结果,与实际分类和质量的情况基本相符,如列于质量好的第一类、综合因子得分分列第二的宁夏某枸杞研究所,其培植生产的枸杞子质量高,一直起到行业示范作用。

2.3聚类分析聚类分析又称又称集群分析,是根据研究对象特征对研究对象进行分类的一种多元分析技术,把性质相近的个体归为一类,使得同一类中的个体都具有高度的同质性,不同类之间的个体具有高度的异质性。聚类分析能够充分利用原始数据信息,除常用于中药系列品种的分类外,还可以广泛地引用于真伪鉴别、成分浅析、质量评价、新旧工艺或不同炮制方法比较、寻找代用品及扩大药用新资源等方面。辛海量等采用聚类分析,对不同来源的蔓荆子、黄荆子、牡荆子近红外漫反射指纹图谱进行分析,聚类分析结果与传统植物分类结果一致。李寒冰等对不同批次的板蓝根抗病毒效价值进行聚类分析,聚类结果与常规质量等级分类一致,结果表明应用抗流感病毒效价检测方法,可以实现对板蓝根药材的质量控制。鄢丹等采用生物热活性检测方法,以黄连道地优级药材为工作参照物、第一指数生长期生长速率常数(k1)为反应值,以量反应平行线(3•3)法设计试验,对7批不同产地的黄连样品的生物效应(效应谱和效应值)进行测定,并采用聚类分析对黄连的生物效价值进行分析,结果表明不同产地黄连的生物效应值存在差异,并以此划分的典型道地产区、一般道地产区和一般主产区,与传统对黄连的道地产区和主产区划分基本一致,生物效应值具有较强的产地专属性和指纹鉴定意义,生物热活性检测方法可作为传统生物效价检测方法的补充和提高。

2.4判别分析判别分析是根据一定量案例的1个分组变量和相应的其他多元变量的已知信息,确定分组与其他多元变量之间的数量关系,建立判别函数,然后便可以利用这一数量关系对其他未知分组类型所属的案例进行判别分组,主要包括距离判别、Fisher判别和Bayes判别分析等。在实际应用中,当已知了类别的判别问题时,应选择判别分析;而当面对大量的数据,杂乱无章,而又需要分类时,应考虑聚类分析;二者有衔接之时,聚类分析可作为判别分析的预处理。白雁等采用距离判别分析对来源于山东、山西和焦作的生地黄近红外漫反射指纹图谱进行分析,结果表明欧氏距离在0.6以上时生地黄被分为5类,其中山东因样品差异比较大,分成了3个区域,其他2个区域为山西和焦作样品,分类结果与实际基本一致,且15批验证集样品的预测集正确率为85%以上,为地黄产地鉴别方法提供1种新技术。吴文莉等采用Fisher判别分析对105种中药中42种元素含量进行分析,以42种元素含量的百分位值,对依据全国大中专院校教材《中药学》查询的105味药物的寒、热、温、凉四性,建立4类Fisher判别方程,整体回判复合率为80.9%,研究表明通过分析测定中药中所含微量元素的量,能在一定程度上反映中药的性能,为进一步研究中药的物质基础提供指导。

2.5典型相关分析典型相关分析是对每组变量做1个线性组合,即为这组变量的综合变量,然后研究2组综合变量的相关,通过少数几个综合变量来反映2组变量的相关性质。典型相关分析也是利用降维思想,主要对质量评价、成分浅析、新旧工艺或不同炮制方法比较、寻找代用品及扩大药用新资源等方面进行研究。王伽伯等采用典型相关分析,对大黄炮制减毒机制和化学成分改变间的相关性进行探讨,结果表明炮制可降低大黄肝肾毒性,其机制与结合蒽醌和鞣质类成分的下降有关,其中与游离和结合态的芦荟大黄素及大黄素甲醚相关性最强;在肝肾生化功能指标中,血清谷丙转氨酶(ALT)和肌苷(CREA)对肝肾毒性较敏感,可作为临床监测指标,为大黄炮制工艺的优化及肝肾毒性临床监测指标的筛选提供了方法参考。卢林耿等对利用典型相关分析,对中药复方制剂工艺因素和药物成分间的关系进行了分析,结果表明大黄素和羊藿苷受制剂工艺影响较大,而芍药苷几乎不受影响;煎煮时间越长,大黄素和羊藿苷含量越低;加水量越多,大黄素含量越低,而羊藿苷含量越高;浸泡时间与这3种成分的含量成反比,但其影响作用较小,典型相关分析在中药复方制剂工艺研究中的应用有其重要的价值。

2.6多元统计的联合应用近年来,不仅单一多元统计分析得到广泛应用,多种统计方法的联合运用也得到快速发展,它能够更客观地实现中药质量的全面控制。王海波等利用因子分析、聚类分析对黄芪中的无机元素含量进行分析,因子分析和聚类分析法的研究都表明黄芪主要判别元素确定为K,Mg,Na,为从不同分析角度实现黄芪饮片的质量控制提供了依据。王晓燕将寒性、热性各10味植物药所含的多糖成分水解成单糖,并测定单糖的HPLC图谱,利用主成分—线性判别对该HPLC图谱进行分析,20味中药判别结果与已知药性完全一致,表明中药寒热药性与所含的多糖成分存在明显相关性;主成分—线性判别可对中药药性进行判别,且判别准确率高。尹海波等利用主成分分析和聚类分析,对10个不同产地的牻牛儿苗样品中24种无机元素的指纹图谱进行分析,以总方差贡献率为91.5%选取前5个因子,主成分分析得出其特征元素为铝(Al)、铊(Tl)、钡(Ba)、铁(Fe)、镧(La)、铈(Ce)、锂(Li)、镓(Ga)和钯(Pd),聚类分析将路边生长和山坡生长的牻牛儿苗样品聚为一类,结果表明元素的分布特征与牻牛儿苗的生态和产地呈一定的相关性。鄢丹等利用相关分析对盐酸小檗碱和不同产地黄连样品的生物热动力学参数(包括生长速率常数、产热量、生长期最大产热功率和达峰时间),和常规抑菌活性评价指标抑菌圈直径进行分析,结果表明生物热动力学法可用于黄连抑菌活性的测定;对不同产地黄连药材的抑菌效价进行聚类分析,结果将不同产地的黄连聚为一类,为利用生物热动力学法和抑菌效价测定法共同实现黄连抑菌活性评价提供依据。

3小结和思考

第12篇

1区域地质概况

研究区位于新疆维吾尔自治区富蕴县境内,海拔2000~3200m,气候寒冷、年降水量丰富,多以降雪为主,属典型的北温带大陆性气候寒冷区。区域大地构造位置处于阿尔泰地槽褶皱系哈纳斯—忙代恰褶皱带—诺尔特复向斜内。区内构造以断裂构造为主,褶皱构造次之,构造线总体呈NW—SE向分布,NW—SE向断裂具有明显的控岩作用。近EW向和NE向断裂多属平移断层,横切地层和NW向构造。褶皱构造主要为诺尔特复向斜,因受到近EW向断裂的影响,向斜中部呈NWW向。区内侵入岩较为发育,呈较大的岩基或岩株产出,岩性以黑云母花岗岩、二云母花岗岩为主。

2土壤地球化学测量数据处理

采用Spss统计软件进行数据处理,首先对原始数据进行要求排序,然后检验数据是否服从正态分布。对不服从正态分布的数据,首先采用迭代法处理特高值以及特低含量值,或采用对数进行统计,将高值剔除,直至总体样品近似服从正态分布;然后通过直方图与正态曲线直观对比和结合峰度及偏度等参数,选择最佳分组生成特征数据,统计得出各种元素的背景含量和标准差,计算得出各元素的异常指标以及异常分带指标;最后利用Spss软件对各元素进行多元统计分析,对相关元素组合进行分类,找出元素之间的亲疏关系,探索成因联系,进而提取元素组合异常,从而更有效的圈定预测靶区。

3地球化学异常找矿模型

依据成矿背景及多元统计分析结果、化探元素异常组合特征等可建立区域地质-在地质环境和成矿条件相对比较好的区域如果有矿体存在,采用土壤地球化学测量法在此处进行找矿时,均有强弱不同的异常存在。因此可以利用地质-地球化学综合信息找矿模式,在新疆富蕴县喀依尔特河上游地区进行找矿靶区预测。

4结论

(1)采用多元统计分析方法对研究区土壤地球化学采集数据进行相关分析、聚类分析、因子分析,得出Au-Sb-Cu、Pb-Zn-As、Sn-W等元素异常组合。

(2)依据成矿背景研究及多元统计分析结果、化探元素异常组合特征,建立了区域地质-地球化学综合信息找矿模型,该模型为研究区找矿工作提供了理论依据。

(3)结合区内成矿模式和区域地质特征,按照异常形态、规模以及强度、出现的空间位置和套合对映关系等信息,对研究区内的异常进行综合分类,圈定找矿远景区范围,将异常地段进行分类分级处理,圈定出Ⅰ、Ⅱ、和Ⅲ类找矿靶区。

作者:王振东马维明罗永统单位:青海省地质调查局