时间:2023-07-10 17:34:24
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇统计学变量的定义,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
【关键词】贝叶斯统计;后验分布;比较法
【Abstract】According to the characteristic and the teaching difficulty of Bayesian statistics, we introduce the definition of posterior distribution by comparing the Bayesian formula in classical statistical. Combining with case study and using mathematics software, students can understand the meaning deeply and calculate quickly. Through the importance of posterior distribution in Bayesian statistics, students could have deep experience in the future study. We should also cultivate students' autonomous learning interest and the ability of creative thinking to solve the problem.
【Keywords】Bayesian statistics;Posterior distribution;Comparison method
贝叶斯统计是统计学专业中唯一一门非经典统计学的学科。英国学者贝叶斯的遗作《论有关机遇问题的求解》,提出了著名的贝叶斯公式和一种归纳推理方法,成为了贝叶斯学派的奠基石。之后,在Jeffreys、Good、Savage、Berger等学者的不断努力下,把贝叶斯方法在观点和理论上不断完善,并在工业、经济、管理等领域获得了成功的应用[1]。目前,贝叶斯学派已发展成为一个有影响的统计学派,打破了经典统计学一统天下的局面,占据了统计学的半壁江山。
1 贝叶斯统计的特点和教学难点
贝叶斯统计是在与经典统计的争论中逐渐发展起来的。其基本思想和观点是:总体分布中的未知参数可以看作随机变量;事件的概率除了用频率解释外,还可用个人经验和历史资料来获得,即承认主观概率;在经典统计所用的总体信息和样本信息外,还充分利用了抽样之前的信息―先验信息,并可根据先验信息获得先验分布。而这些观点在经典统计学看来都是不合理的。实际上,人们在生活中都在不知不觉的运用贝叶斯的思想解决问题。比如,医生在做手术之前会根据病人的病情和自己的经验估计手术成功的概率;免检产品的鉴定需要利用该产品以往的不合格品率的历史资料,若多次在零附近,且每隔一段时间抽查,仍保持该结果,则认定该产品为免检产品。这些实例都是在运用了先验信息后才得到了更好的解决,因此,若能充分利用先验信息,对于解决很多统计问题,无疑是非常有利且有效的。
然而正是由于贝叶斯统计独有的思想和方法,学生在习惯于以往所学的经典统计的课程思路情况下,接受起来有一定的困难。因此,教师在教授过程中一定要深入浅出,运用实例,易于学生理解。将贝叶斯统计与经典统计比较讲授相关内容,让学生从熟悉的知识进入,循序渐进逐步认识贝叶斯方法和理论。
2 比较法引入后验分布定义,案例加深理解,数学软件辅助教学
后验分布的定义是贝叶斯统计中第一章课程的内容,学生刚刚接触,理解起来有一定的难度。可由经典统计中所熟悉的贝叶斯公式引入讲解,比较容易接受。另外通过实用案例,激发学生的学习兴趣,并能更好理解定义。
2.1 贝叶斯公式
这就是概率统计中著名的贝叶斯公式,也叫逆概率公式[2]。我们可将事件B看作是试验结果,A1,A2,…,An看作是导致结果B的原因。则该公式表明了结果B发生条件下由第i个原因导致的概率。即执果索因[3]。
案例1
已知5%的男人和0.25%的女人是色盲,现随机挑选一人,检验为色盲,若男人和女人各占人数的一半,问此人是男人的概率。
设B为随机抽取一人为色盲,A为随机抽取一人为男人,A为随机抽取一人为女人。则P(A)=0.5,P(A)=0.5,且P(B|A)=0.05,P(B|A)=0.0025。故根据贝叶斯公式,有:
在贝叶斯公式中,结果B可认为是已经出现的样本数据x,发生结果的原因Ai可认为是未知的随机变量θ的取值。于是将贝叶斯公式推广可得到后验分布的离散形式定义。
2.2 后验分布的离散形式
设总体x服从分布密度p(x|θ),其中θ为离散型随机变量,取值为有限个或可列个。即θ=θi,i=1,2,…。θ的先验分布为π(θi)=P(θ=θi),i=1,2,…。样本的观察值为x=(x1,x2,…,xn),样本联合分布密度为,则θ的后验分布为:
将离散形式推广得到连续形式的后验分布定义。
2.3 后验分布的连续形式
2.若总体x为离散型随机变量,则总体分布密度p(x|θ)改为分布列P(X=x|θ),后验分布的离散形式和连续形式就不难写出来了。
先验分布π(θ)反映了人们在抽样前对参数θ的认识,而后验分布π(θ|x)则是在获得了样本后,对参数θ的认识,是人们利用总体信息、样本信息(统称为抽样信息)对先验分布π(θ)的认识作调整的结果。
案例2
英国统计学家Savage(1961年)考察一个统计实验:一位常饮牛奶加茶的妇女声称,她能辨别先倒进杯子里的是茶还是牛奶。对此作了10次试验,结果她都说对了。
若不考虑该妇女的经验,则应认为每次她猜对的概率为0.5,则10次猜对的概率为0.510=0.0009766非常小,显然与实际不符,不合理。因此应该充分利用经验,即先验信息。对该妇女的了解,认为有可能她每次猜对的概率为0.95。设θ为她每次猜对的概率,则取值为0.95或者0.5。
可见,抽样前后,对于猜中的概率θ=0.95的可能性从先验概率0.6变为后验概率0.9989,提高了很多,这主要是由于考虑了样本(10次全部猜对)的缘故。后验分布正是在样本参与下对参数θ的认知的改变,这个案例生动形象的说明了后验分布的含义。在进行计算和分析过程中,如上述的后验概率计算,可以运用Matlab等数学软件辅助教学工具。适当安排数学实验课程,使得学生能够很好的掌握有关贝叶斯统计课程的数学软件的使用。
3 后验分布在贝叶斯统计中的地位及作用
后验分布是基于总体信息、样本信息和先验信息三种信息的综合结果,是一个非常重要的定义,在整个贝叶斯统计学中起着基石一样的作用。贝叶斯统计的点估计、区间估计、假设检验及预测等统计推断问题都是建立在后验分布基础之上进行的。而在后验分布引入损失函数之后,便构成了贝叶斯决策理论的基本框架。显然,后验分布在贝叶斯统计中占有举足轻重的地位,可以说任何贝叶斯统计问题都离不开后验分布。因此,在学习该定义之初应使学生能够理解好,并灵活运用定义。在后续其他贝叶斯理论的讲授中应逐步加深对该定义的认识和应用。
4 结束语
贝叶斯统计课程是在统计学花海中的一支独秀。通过对后验分布定义的教学研究探索,我们可以将其方法推而广之,运用到贝叶斯统计中的其他理论知识的讲授中。在教师教学和学生学习的过程中,贝叶斯方法和思维方式都是与其他统计学科非常不同的。因此,可以在与熟知的经典统计学的对照中比较学习,深入浅出,列举实际案例,易于理解。通过案列的讲解还能激发学生的学习兴趣,提高主动思考和解决实际问题的能力,培养学生的创新意识和应用能力。当学生遇到某个问题时,若能不仅局限于经典统计方法,还能考虑到使用贝叶斯方法结合解决,也就具备了贝叶斯思想,那么该课程的开设便达到了目的。若能有部分同学有兴趣进一步拓宽贝叶斯方法的应用领域,深入研究学习,那么我国的贝叶斯统计研究就后继有人了。
【参考文献】
[1]茆诗松,汤银才.贝叶斯统计[M].北京:中国统计出版社,2012:5-6.
关键词:资本结构 影响因素 国家所有权 越南
一、引言
莫迪利亚尼和米勒(1958)的资本结构定理出现以来的六十年中,一系列关于企业资本结构的新理论和实证研究得到提出,但仍有争议,回答了三个问题:
(1)资本结构的决定因素是什么?
(2)企业怎么选择资本结构?
(3)资本结构如何影响企业的价值?
以往的实证研究旨在解释资本结构的影响因素和寻找支持理论的证据,主要基于自发达国家与新兴经济的数据。最典型蒂特曼和韦塞尔斯(1988),拉詹和津加莱斯(1995)等。尤其,陈.J.J(2004),黄贵海和宋海(2006)都认为,似乎有中国彩色性的新啄食顺序假说,优先顺序是留存盈利、股本及最终为债务融资。关于越南企业,陈挺魁元,拉马钱德兰(2006)发现,企业规模与资本结构的各种测量之间具有统计学显著性正相关。
研究的目的对越南企业改革方案实施20年之后的越南企业资本结构进行更深入、更新的了解。研究中使用135家胡志明市证券交易所自2009至2012年非金融类上市公司的一部数据库以及一群的12个解释变量,包括国家所有权的哑变量。
二、越南的财经环境
1986年越共“六大”开始了“革新”路道。据此,高度集中的计划经济转换为社会主义定向的市场经济。革新后,越南国营企业占主导,多种所有制企业共同发展。国有企业转型的过程归结如下:自主化-市场化-公司化-股份化-集团化。
为排忧解难国有企业在于经济转型时期的早期阶段,政府已颁布1992年的国有企业改革方案,据此进行转换所有形式而具体就是国有企业的股份化。它正是将国有企业的部分或全部价值转让私人所有权。这使得企业逐步变得更加独立,而不是像此前那样依靠政府如今公司得自身解决其内部如资本、产品出路等问题,重要的是要维持如何合理的资本结构。
20年过去已显示在国民经济中私营部门和私人资本(私人所有权资)的作用日益重要和显着下降国有企业的。政府现在只控制关键与高公益性的行业,如电力、航空、石油和天热气以及电信。另一方面,越南股市的诞生和发展正是经济改革的必要成果。到目前为止股市已经有点成为一个筹集资金给704家企业的渠道以及市场资本值占2012年国内生产总值的26%。
然而,越南股市有时候已陷入“过热”期间,被认为很容易“蒸发”。一方面,是由于投资者的从众心理和信息不对称的问题。另一方面,是由于对企业和投资者参与股市时缺乏强有力及强大的制定。
事实上,国家所有权在于大多数上市公司之下不同限度。这表明了民营企业和合资企业参与股市不多。解释的理由很多,其中我们认为由不足“信心和力量”的原因。然而,逆境是股市尽管有非常“热闹”的活动时期,但许多公司仍然使用多债务为其营运提供资金,而主要为短期债务。因此,可以认为股市仍未事实有效的运作,也显示了越南的企业债券市场仍然有很大的限制。另一方面,也显示了该公司对与债权人仍不够信任,并银行对与长期贷款仍然使用一列安全的措施。这可能由于投资者与企业、企业与银行之间的信息不对称。
三、变量的描述和建设
(一)自变量
1、业务风险
业务风险是指未来公司的运营有关的风险。业务风险变量被定义为利息及税项前盈利的标准偏差。
2、有形性
公司以高有形资产期望具有有高资本结构并由低债务成本和负债的问题更少,因为高有形资产的公司可以提供更多的抵押品。本研究采用有形资产/总资产率作为有形性的代表。
3、自由现金流
詹森(1986)指出,自由现金流指的是超过了所有净现值项目的筹资需求的现金流。企业具有高自由现金流则预期具有较低的资本结构。自由现金流变量被定为税前利润加固定资产折旧减实际缴纳的所得税/总资产的帐面价值。
4、增长机会
高增长机会的公司将使用更少的债务减少问题。米勒(1977)立论,要是用短期债务代替长期债务,问题可得以减少。增长机会变量定义为总资产的变化比例。
5、折旧税盾
迪安吉罗和马苏里思(1980)认为,公司使用非利息账目为降低企业的实缴所得税,如折旧费用、税收信用及福利基金等账目。在越南的折旧税盾中,资产折旧是经常使用的最重要的账目。所以,折旧总资产率使用为本研究的折旧税盾变量的。
6、盈利能力
静态权衡理论认为,盈利能力的公司将更多借款为税收的好处。詹森(1986)提出,为了防止管理人员浪费自由现金流,有高盈利能力的公司将使用高债务。盈利能力变量被定义为利息及税项前盈利/总资产率。
7、企业规模
权衡理论认为,较大的公司拥有债务的成本代表较低、现金流的波动较少、接近信贷市场更容易和倾向于更多的债务为获得受惠自税务盾。啄食顺序理论则提出,较大的公司预期较少的信息不对称,所以导致其股本得更多的吸引力。企业规模被定义为总资产的自然对数作,因为资产的结构特点将确保其真实性高于销售收入的。
8、企业独特性
公司拥有独特的产品往往具有较低的财务杠杆,由于产品的独特性往往与破产成本较高。言下之意,如果公司倒闭了,企业的库存及制造设备的二级市场带着竞争性可能不存在。企业独特性变量被计量为销售成本/销售收入率。
9、流动性
詹森(1986)研究发现,多现金的公司将增加新贷款,以防止管理者擅自作出浪费自由现金流的决定。公司拥有高流动性似乎给债权人带来公司对实现短期债务义务的能力的好信号,应该让公司接近更好的贷款资金。流动性变量定义为短期资产/短期债务的比率。
10、经营时间
阿赫塔尔和奥利弗(2009)表明,老年的公司预期更高的债务由较低的长期债务的成本。这些公司也有较低的倒闭风险,应该有更高的可靠性,从而容易获得更高的债务。经营时间变量的计量是操作年数自成立日以来的自然对数。
11、实际税率
莫迪利亚尼和米勒(1963)的专题研究提供了税收有对企业资本结构的重要性。据静态权衡理论,实际税率与财务杠杆预期正相关。本研究中希望找到税对资本结构的影响的清晰证据,所以实际税率变量测量为实缴所得税/应税收入。
12、国家所有权
国家所有权的作用仍是一个有争议的话题。中越两国有许多相似之处如:都正在于将集中经济转换市场经济的时期;当今的许多企业都是从国有企业被私有化、股份化,而其中国家持有控股或部分股份;金融体系仍主要地依赖于银行,国有商业银行仍然占主导地位和给国民经济供应大部分的银行信贷。
本研究提供国有所有权变量在于一组更大的解释变量。国家所有作为一个虚拟变量,值为1如果是国有企业按2005年越南企业法(含国家控股比例的51%以上),其他为0。
(二)因变量
本研究采用三个因变量来计量资本结构,基于帐面价值。具体是:
(1)债务率,被计量为总债务对总资产。
(2)长期债务率,被计量为长期债务对总资产。
(3)短期债务率,被计量为短期债务对总资产。其中,短期债务是指可以在一年内偿还公司的债务,包括短期借款、银行信贷、应缴税款及其他负债。
四、研究方法和数据说明
(一)研究方法
本文使多元回归分析进行检验上面建成的解释变量与因变量。我们使用面板数据被收集于2009-2012年时间序列。回归模型如下:
Ylit=β0+∑βkXkit+uit
其中:Y为因变量,X为自变量
l为因变量的数目,l=1,2,3
k为解释变量的数目,k=1,2,...,12
i为观察企业数量,i=1,2,...,135
t为观察年数,t=1,2,3,4
β0为常数
βk为自变量系数
uit=μit+εi,εi是随机误差与ε~N(0,δ2)和μit板数据误差,
(二)数据说明
本文采用一部最新二级数据。本数据取自胡志明市证券交易所135家非金融类上市公司于2009-2012年期间的经审核财务报表,包括27家国有企业(国家所有权的51%以上)。
由越南股市的数据限制和“缓解蒸发性”,所以在本文中我们只能用帐面价值,而不是像其他国际问题研究同时使用上述两种。此外,由于商业信用仍然被使用如金融工具,所以我们以计量因变量提供商业信用。
五、研究结果与讨论
(一)描述统计
表1描述统计数据的结果和解释变量与因变量之间的关系。如此:
表1:统计描述
■
平均债务率为48.25%,并国有企业的债务率并不显着高于其他公司。平均长期债务率为15.44%,并国有企业的18.22%。平均短期债务率为36.71%,而国有企业的是30.68%。这些的表明,越南公司使用长期债务多于短期债务,无论国有企业还是非国有企业。这解释了由企业债券市场未发达,银行贷款仍是外部的主要资金。导致公司得主要依靠于股本及短期债务,该公司还展示了股本比债务更多地使用。
统计的结果显示,2009-2012年期间上市公司的平均增长机会率为8.68%和平均盈利能力率为18.06%高于2002-2003年期间的(对应的结果是7%和3%)。表明了资本市场(股市)的积极效应。
(二)实证结果
表2提出对检验解释变量和因变量运行回归模型的结果。其中,X1,X2,X4,X6,X7,X8,X9,X10,X12变量拥有1%和5%的统计学显着性。分析比较结果如下:
业务风险与债务率正相关,但无统计学显著性,同时与长期债务率有一个统计上显着正相关,但差0很少。言下之意,公司使用长期债务越高业务风险越大,与反之。
有形性是统计学显着性负相关与债务率和短期债务率,但与长期债务率正相关。含义,有高有形资产的公司会倾向使少用短期债务由于贷款时间与资产特性之间的符合性。
增长机会对三个财务杠杆测量为正相关,但只对债务率和长期负债率有统计学显著性。这含义,越南股市的发展仍然显着限制,虽然国内股市有时热闹的运营。然而,也表明,越高增长的公司使用越多的债务。换言之,也表达大公司仍然主要依赖于银行贷款。这些与啄食顺序理论和发达国家的研究结果是一致的。
盈利能力负相关与所有财务杠杆,但唯一对短期债务率的测量没有统计学显著性。像所有上述研究,这些结果支持啄食顺序理论。
企业规模与债务率和长期债务正相关,并与短期债务率负相关(所有统计学显著性)。像中国和一些新兴经济体,公司有短期债务率更高则有规模更小。与越大的公司更容易获得长期贷款,并同时显示较大的上市公司规模可以更容易地选择长期债务和短期债务之间。
企业独特性只与短期债务比率统计学显著着正相关。该企业独特性越清晰越多的地使用短期贷款。与此同时我们发现,该公司有日益高的独特性将少用长期债务,
原因可能公司破产时没有对库存及生产设备清理的高竞争性的二级市场,然而我们的研究结果非统计学显著性。
研究中的指出,流动性跟债率务和短期债务率具有正相关,并与长期债务率负相关(都于1%统计学显著性)。因此,因为越南企业主要以短期债务为筹资,所以可说,流动性总体上与资本结构为负相关。言下之意,高流动性的公司将使用较少的债务,因高度流动性的资产给该公司的业务用于资助。本研究的发现符合啄食顺序理论。
经营时间跟短期债务率有统计学显著性的正相关,并与短期债务率有非统计学显著性的负相关。表明了经营时间的企业越久则有越大的资本结构是符合与越南的背景之下,是筹资主要来自短期债务的地方。这也给各种类型公司作为确实,无论国有公司或非国有的,由于实际上越南的上市公司主要是从国有企业的股份化。
一些我们的发现差异越南的以往研究结果是国家所有权与债务率和长期债务率的正相关关系(都于1%统计学显著性),但跟短期债务率负相关(无统计学显著性)。越高国家所有权的公司越容易地获得信贷,特别是长期债务,由于公司与债权人之间的关系已经形成公司股份化之前。
三个回归模型的结果显示,所有的三个本研究中的财务杠杆拥有较高的统计性解释力。其F检验结果表达没有自相关的现象和多重相关性,也说明了其计量经济模式是合理的。
六、结束语
本文尽量检验135家非金融类越南股市上市公司自2009至2012年期间的最新面板数据,得了结论如下:
首先、资本结构的啄食顺序理论和静态权衡理论基本上解释越南公司的筹资决策。第二、发达国家及新兴经济体(特别中国)的资本结构影响因素可以采用与公司于越南,该国家正在将中经济向市场经济转换的过程中。第三、该公司在股市交易上使用更少的长期贷款,而主要是短期贷款。原因是,越南的企业债券市场尚未开发,从而该公司的资金主要地依靠于取决于权益资本、银行贷款及商业信用。最后,国家所有权率在公司的融资决策中起着重要的作用。本研究的发现是公司跟越高的国有资本比例,越容易地获得贷款一般和尤其是长期贷款。综上所述,一家公司的资本结构决策不但依靠于其自身的特点,而且被很大地影响了自其外部制度环境。
参考文献:
[1]阿赫塔尔和奥利弗.日本跨国与国内企业的资本结构决定因素[J]。国际财务回顾,2009年,第9期
[2]陈J.J.中国上市公司资本结构的决定因素[J]。商业研究,2004年。第57期
[中图分类号]R284 [文献标识码]C [文章编号]1673-7210(2008)01(b)-164-02
木瓜具有平肝和胃、去湿舒筋、护肝降酶、生血和抗菌等功效,在临床中多用于湿痹拘挛、腰膝关节酸重疼痛、吐泻转筋和脚气水肿等。在木瓜所含的各种化合物中,黄酮类化合物具有抗感染、抗病毒、解痉、抗癌和保肝等多种生物活性。本文主要介绍木瓜不同炮制品(生品、蒸制和炒制)中,黄酮含量比较的数据分析方法。
1 不同制品木瓜的黄酮含量
取皱皮、光皮木瓜各3份,其中2份分别进行蒸制和炒制处理,在不同的溶解时间分别测量生品、蒸制品和炒制品中黄酮含量[1],结果见表1。
从表1可以看出,不同品种间测量值有差异,同一时间在不同制品间测量值有差异,同一制品在不同时间测量值也有差异,因此对不同制品中黄酮含量的比较,应采用多因素方差分析。由于黄酮含量测量值随着溶解时间的增加而增加,在多因素方差分析中可以把时间作为协变量,使用协方差分析[2]来比较不同品种、不同制品间黄酮含量的差异。
协方差分析的基本思想是,在作多组均数Y1,Y2,…YK的比较前,用线性回归方法建立各组分析变量Y和协变量X间的数量关系,求得在假定变量X相等时各组分析变量的修正均数,然后用方差分析对各组修正均数进行分析。协方差分析要求:①各组分析变量和协变量的关系是线性关系;②各组分析变量Y的残差服从正态分布;③各组分析变量Y与协变量X的回归斜率相等。其中,第3点回归斜率相等(即回归直线平行)是最重要的,在进行协方差分析前,应先对各组回归直线的平行性进行检验。平行性的检验可以通过对协变量和分组变量的交互作用的分析来判断,若交互作用无统计学意义,则可认为满足平行性条件。本文中分组因素有“品种”和“方法”(炮制方法),平行性的检验可通过对“品种”、“方法”和“时间”的二级交互作用的检验来判断。下面是使用SPSS中General Linear Model[3](一般线性模式)过程中的Univariate(单因变量多因素方差分析)命令进行协方差分析的过程和方法。
首先建立分析变量名为“黄酮含量”、因素变量名为“品种”和“方法”、协变量名为“时间”的SPSS数据文件[3]。方差分析要求各组观察值残差服从正态分布,因此需要对变量“黄酮含量”作平方根反正弦转换。在SPSS的“Date View”(数据窗口)菜单中“Transform”子菜单中,可使用“Compute Variable”来转换[3](本文对数据的转换方法不作详细的介绍),转换后的变量“转换值”满足协方差分析要求的第2条。
2 各组回归直线平行性的检验
在打开的SPSS数据文件的Data View(数据窗口)中,单击菜单栏上的“Analyze”,在菜单中移动光标到“General Linear Mode”单击子菜单中“Univariate”,进入Univariate 分析对话框。在Univariate 分析的对话框中:
把变量“转换值”作为分析变量送入 Dependent Variable: 框中;把因素变量“品种”、“方法”送入 Fixed Factor(s) 框中;把协变量 “时间”送入 Covariate(s) 框中。
各选项完成后的对话框见图1。单击按钮“Model…”(模式)进入模式定义对话框。在模式对话框中,选择Custom(自定义)。在左边的Factors & Covariates列表框中:
依次把变量“品种”、“方法”、“时间”送入右边的Model文本框中;
选中“品种”和“方法”,把交互项“品种*方法”送入 Mode 框中;
选中“品种”、“方法”和“时间”,把交互项“品种*方法*时间”送入 Model 框中。
各选项完成后的对话框见图2。单击“ Continue”( 返回)返回主对话框,单击“OK”(确定)后,Univariate 分析的结果见表2。
从表2中的输出结果可以看到,交互项“品种*炮制方法*时间”的显著性概率 P = 0.884 ,远大于0.05,无统计学意义。可认为各组黄酮含量与溶解时间的回归斜率没有显著性差异,各回归直线满足平行的条件。
3 不同制品间黄酮含量差异的比较分析
本文中不同品种木瓜、不同炮制方法加工的制品黄酮含量的比较,是属于组中分组的实验,在分析中可以不考虑木瓜品种和溶解时间的交互作用。因此在不同品种、不同制品间黄酮含量差异的分析中,只需在前面Univariate 分析的定义模式(Model)对话框中:
在Model 框中,双击“品种*方法”,移出“品种*方法”;
在Model 框中,双击“品种*方法*时间”,移出“品种*方法*时间”;
单击“Continue”( 返回)返回主对话框,单击“OK”(确定)后,得黄酮含量差异分析的协方差分析结果(表3)。
从表3的输出结果中可以看到,不同品种间木瓜间的P=0.000
[参考文献]
[1]郭锡勇,唐修静,郭莉莉.木瓜不同炮制品中总黄酮含量测定[J].贵阳中医学院学报,2000,2000,22(4):61-62.
[2]张文彤.SPSS统计分析高级教材[M].北京:高等教育出版社,2004.
[3]卢纹岱.SPSS for Windows统计分析[M].北京:电子工业出版社,2000.
【关键词】高龄老年人;生命质量评价;总体健康状况自评
【中图分类号】R195 【文献标识码】A 【文章编号】1004-7484(2012)13-0449-02
1947 年世界卫生组织给健康下的定义为: “健康不仅仅是没有疾病和病痛, 而且还包括身体、心理和社会方面的完好状态[1] ”。1990 年WHO提出了“健康老龄化”,1993 年第15 届国际老年学会提出了“科学为健康老龄化服务”[2]的人口老龄化应对目标。国内外对老年人生命质量进行了大量研究,取得了较多的研究成果。本研究以SF-36量表为测量工具,在山东省选择70岁及以上老年人进行生命质量状况的调查,以了解其生命质量的总体状况及影响因素,为提高老年人生活质量,促进健康老龄化的制度安排提供参考。
1 对象与方法
1.1 研究对象 本次调查的对象是山东省居家养老和机构养老的70岁及以上老年人。采用分层方法把山东省的老年人划分为沿海、中部、西部3种地区类型,每个类型随机抽取3个地级市,在被抽取的地级市中以市(县)为单位进行随机抽样。
1.2 调查方法 调查问卷包括一般情况表(养老方式、性别、年龄、受教育程度、婚姻状况、过去从事的职业、目前的收入来源、生活状况等)和健康状况调查问卷(SF-36),分为居家养老卷与机构养老卷,调查者是通过专门培训的研究生及本科生采用统一导语入户对老年人进行调查,能独立填写问卷的由其独立填写,对于没有阅读能力或不能填写问卷的老年人,由调查人员朗读问卷内容,请其作答,由调查人员代为填写问卷。共发放问卷590份,回收有效问卷558份,回收率94.6%。
1.3 统计学方法 应用Epidata3.1数据库双机录入,SPSS16.0软件包进行数据处理,对一般人口学特征等进行统计描述;单因素分析应用?2检验,多因素分析应用有序分类变量的Logistic回归分析。
2 结果与分析
2.1 人口社会学特征的描述分析
居家养老老人324人,机构养老老人234人,共558人,其中男288人(51.6%),女270人(48.4%)。年龄70~79岁393人(70.4%),80岁及以上的高龄老人165人(29.6%)。婚姻状况:有配偶234人(41.9%),丧偶306人(54.8%),离异4人(0.8%),未婚14人(2.5%)。文化程度:未受过教育269人(48.2%),小学174人(31.2),初中48人(8.6%),高中、中专及技校36人(6.5%),大专及以上31人(5.5%)。居家养老老人和机构养老老人年龄、性别,受教育程度分布差异无统计学意义,过去从事的职业、婚姻状况、生活状况差异有统计学意义(P
2.2总体健康状况自评及相关因素差异性分析
本研究将老年人的总体健康状况分为5个等级,分别是“1=差、2=一般、3=好、4=很好、5=非常好”。总体健康状况自评的居家养老老人与机构养老老人差异无统计学意义(P>0.05)。“性别”在老年人总体健康状况之间的差异性无统计学意义(p>0.05),可以认为老年人总体健康状况在性别分布上无差异。“年龄”、“受教育程度”、“婚姻状况”与老年人总体健康状况之间的差异性有统计学意义(P
2.3总体健康状况自评影响因素的Logistic回归结果及分析
单因素分析仅对总体健康状况自评的差异性进行检验,而没有对影响因素进行归因分析,因此需要进一步做多因素分析。以总体健康状况自评为因变量,运用SPSS16.0统计软件中的有序分类变量回归方法进行分析,纳入模型中的自变量有年龄、性别、受教育程度、目前婚姻状况、职业、养老方式以及生活状况7个自变量。模型检验及回归结果如下。
2.3.1 模型检验
表2为对模型中是否所有自变量偏回归系数全为0进行似然比检验,结果P
2.3.2 方程中的有效变量及参数检验
在纳入模型的7个变量中有年龄、养老方式及生活状况3个自变量对总体健康状况自评的影响具有统计学意义(P
3 讨论
3.1 年龄与总体健康状况评价的程度呈负相关关系。“年龄”因素在老年人对生命质量总体满意度评价的回归分析中具有统计学意义。可以认为老人的年龄越大,对生命质量的总体满意度越低,本结论与景睿、刘晓东等[3]的研究结果一致。原因在于,年龄越高,身体机能越低,日常活动能力下降。同时对死亡的恐惧加大,故自我健康的评价较低。可见,年龄是健康状况的风险因素,不仅表现在日常活动能力,而且投射出心理状况的变化。
3.2 经济条件对总体健康状况评价具有积极作用。“生活状况与当地一般家庭的比较”对70岁及以上老人总体满意度影响因素的回归分析中,生活状况“很富裕”“比较富裕”“一般”的老年人,对生命质量的总体满意度更高。原因可能出于以下几个方面:一是生活状况水平高,老年人就可能有更大的选择空间和余地,不为经济所累,过自己想要的生活,生活比较自由[4]。二是生活状况较好的老年人有更好的条件享受医疗保健,更多地参加社交活动,在心理上能够获得更多的满足感,因此对生命质量的总体满意度会较高。
3.3 居家养老老人的健康自评好于机构养老老人。 “养老方式” 因素在老人对生命质量总体满意度评价的的回归分析中,居家养老模式下的老人对自我生命质量评价的总体满意度高于机构养老老人。首先,老年人观念相对保守,接受新事物的能力较弱。居家养老是我国传统的养老方式,在这种环境中老年人往往具有更高的归宿感。其次,老年人年龄大,易产生孤独感与陌生感。居家养老模式能使老年人更容易获得子女以及邻里生活照料、精神慰藉的家庭和社会支持,从而减少孤独感与陌生感[5],因此对生命质量的总体满意度高。
3.4 受教育程度与总体健康状况自评之间的差异性有待于进一步研究。在描述性分析的差异性检验中,受教育程度在总体健康状况自评的差异有统计学意义。受教育程度较高的老年人对生命质量的总体满意度高于教育程度较低的老年人。然而在“受教育程度”对总体满意度自评的影响因素的回归结果显示无统计学意义(见表3),可能的原因在于混杂因素的影响,此问题有待于进一步研究。
参考文献
[1] Velarde-Jurado E et al.Salud Publica Mex,2002,44:349-361.
[2] 李秀燕, 郭继志. 老年人生命质量评价的现状及展望[J]. 国外医学・社会医学分册, 2003,20(4):154-158.
[3] 景睿,刘晓冬等.山东省农村老年人生命质量评价及影响因素分析[J].中国农村卫生事业管理,2008-8 ,8(28)
[4] 林江,杨继峰,刘强. 健康状态认知理论的概述[R]. 广西中医学院院报 2010,13(1):74-75
[5] 王生锋,齐玉梅.中等城市社区人群生命质量评价及影响因素调查[J].山西医药杂志,2008-10,10(37).
作者简介:
(1973.03-)硕士研究生,潍坊医学院讲师,研究方向:老年社会学
关键词:中药新药临床研究;临床数据交换标准;数据管理
DOI:10.3969/j.issn.1005-5304.2016.01.002
中图分类号:R2-05 文献标识码:A 文章编号:1005-5304(2016)01-0009-06
A Preliminary Discussion of Application of CDISC Standards in Clinical Research Data Management of New Traditional Chinese Medicine LU Fang, LI Qing-na, ZHAO Yang, GAO Rui (Clinical Pharmacology Institute of Xiyuan Hospital, China Academy of Chinese Medical Sciences, Beijing 100091, China)
Abstract: In this article, a new TCM clinical trial of phase Ⅲ was served as an example of application of Clinical Data Interchange Standards Consortium (CDISC). It briefly introduced seven data acquisition modules commonly used in clinical research of new traditional Chinese medicine, namely demographics, subject characteristic, clinical event, medical history, questionnaire, laboratory inspection and adverse event. It also introduced the process of transferring the above modules to Study Data Tabulation Models (STDM), and discussed the feasibility and some issues that required attention of CDISC application in clinical research of new traditional Chinese medicine.
Key words: clinical research of new traditional Chinese medicine;clinical data interchange standards;data management
临床数据交换标准协会(Clinical Data Interchange Standards Consortium,CDISC)是一个全球性的、开放的、多学科的、非盈利性组织,通过建立一系列临床研究数据的标准,如临床数据采集标准(Clinical Data Acquisition Standards Harmonization,CDASH)、实验室数据模型(Laboratory Model,LAB)、操作数据模型(Operational Data Model,ODM)、研究数据表格模型(Study Data Tabulation Model,SDTM)、分析数据库模型(Analysis Dataset Model,ADaM)等,来支持临床研究数据与元数据的采集、交换、递交和储存,以优化研究实施、数据交流、统计分析及最后向管理部门递交资料的流程,大大缩短研究周期、节省费用[1]。2014年12月,美国食品药品监督管理局(Food and Drug Administration,FDA)了具有约
束力的数据申报标准指南,要求24个月后开始的临床试验必须使用FDA要求的标准、格式和术语进行注册申请递交,以避免管理部门在审查研究数据时花费较多的资源[2]。我国药政当局也正在着手制定适合我国,特别是中药新药临床研究的数据采集和申报标准,本文从中药新药研究应用CDISC标准实例出发,探讨其应用的可行性和需要注意的问题。
1 建立机构临床研究数据采集标准
笔者曾对CDISC标准进行过解读[3],CDASH由CDISC于2008年10月制定,其目的是简化和规范各个临床研究中心的数据采集,为设计病例报告表(Case Report Form,CRF)提供标准。其由一个基本的数据采集字段集(包括定义变量名称、解释、元数据)组成,适用于临床研究阶段绝大多数CRF的设计。SDTM围绕着临床研究过程中采集的一系列观察信息构建,它规定递交到药政管理部门的临床研究数据库和数据库变量的标准,包括数据库的结构、目的、特征和其所包含的内容,从而使评审人员能够正确理解所递交的数据库信息。
要提交符合SDTM的数据,为减少后期数据库的映射工作,最捷径的做法是在创建数据库时即按照CDASH和SDTM对变量及元数据进行定义,并通过define.xml文件对数据的结构和内容进行描述。笔者参照CDASH和SDTM制定了本机构临床研究数据采集标准,其中数据采集模块共分为18大类,即一般识别变量(Common Identifier Variables)、不良事件(Adverse Events,AE)、伴随治疗(Concomitant Medications,CM)、人口统计学(Demographics,DM)、研究处理情况(Disposition,DS)、药物依从性(Drug Accountability,DA)、心电图检查(ECG Test Results,EG)、研究药物(Exposure,EX)、纳入排除标准(Inclusion/Exclusion Criteria Not Met,IE)、实验室检查(Laboratory Test Results,LB)、病史(Medical History,MH)、体格检查(Physical Examination,PE)、方案偏离(Protocol Deviation,DV)、受试者特征(Subject Characteristics,SC)、物质使用情况(Substance Use,SU)、生命体征(Vital Signs,VS)、量表(Questionnaire,QS)、临件(Clinical Event,CE)。数据库中的变量分为CDISC和机构标准,能够直接按照CDASH或SDTM命名的变量为CDISC,否则为机构标准,在中药新药临床研究中参照此标准进行数据采集。
2 研究实例分析
以一个中药新药Ⅲ期临床研究为例,简要介绍临床研究中需要采集的受试者特征、人口统计学、临件、病史、量表、不良事件、实验室检查等7类数据及将其转换为便于药政管理部门审核的SDTM数据集的过程。
研究实例:A药治疗急性气管-支气管炎(痰热阻肺证)随机双盲、安慰剂平行对照、多中心Ⅲ期临床研究。研究对象为符合急性气管-支气管炎西医诊断标准及痰热阻肺证中医辨证标准,年龄在18~65岁之间,自愿签署知情同意书者。试验组药物为A药(10 mL/次,每日3次),对照组为安慰剂(10 mL/次,每日3次),疗程6 d。主要疗效指标为咳嗽、咳痰症状的改善。本试验数据管理基于电子化数据管理系统,在临床试验开始前,需要对整个试验中的数据管理做出安排,根据试验方案及相关文件,制定数据管理计划。参考机构数据采集标准,明确所要收集的数据及其类型,设计数据采集表格。为方便后期数据库的建立、数据的录入和提取,在设计数据采集表格时,参考CDASH,尽量以CDASH提供的域为单位进行CRF模块布局,使用各域中推荐的变量,其他变量根据方案要求灵活选择;同时,使用CDISC提供的受控术语作为变量结果代码。完成纸质CRF的设计及注释后,在电子数据采集系统中构建电子病例报告表(eCRF)。在数据库设计阶段引入CDISC标准,保持数据标准的统一和数据的可追溯性,可从数据库中直接抽取出大量符合SDTM的数据集,进而减少后期繁杂的映射转换。
2.1 受试者特征
SC是与受试者相关,并且没有被采集到其他域中的数据。如受试者姓名拼音首字母、婚姻状况、受教育程度等。SC域是DM数据的扩展,每位受试者只采集1次数据,一般情况下试验期间该域中的数据是不会更改的。
从电子化数据管理系统导出的数据看,SC数据集为非标准化结构(见表1)。经过转换,原来在数据库中的变量名“MARISTAT(婚姻)”、“EDLEVEL(受教育程度)”“EMPJOB(工作性质)”转化为变量“SCTESTCD(受试者特征简称)”和“SCTEST(受试者特征)”的观测结果,数据结构呈现符合SDTM的结构(见表2)。
2.2 人口统计学
DM数据的结构是固定的,包括出生日期、年龄、性别、民族、人种及国家。在创建DM模块变量池时,为了收集受试者的民族信息情况,我们使用了CDASH中的变量ETHNIC(族群),另外建立了一个变量“ETHNIOTH(其他民族)”,作为机构标准(见表3的CDASH数据集)。在转化为SDTM数据集时,按照CDISC中“RACEOTH(其他人种)”的处理方式,将相关数据放在DM域补充数据集(见表3的SUPPDM数据集)中。对于以SDTM形式上报的数据,要定义一段时间作为受试者“接受试验干预”的参照时间段,开始和结束日期分别以变量“RFSTDTC(参照开始日期)”和“RFENDTC(参照结束日期)”表示。RFSTDTC是为研究开始的第1日,在本实例研究中,根据试验方案,把这段时间定义为从第1次服药日期到最后1次服药日期的时间。
2.3 临件
CE域是获取研究中疾病的发作症状或体征,或者虽然可能导致不良事件,但事件本身并不构成不良事件。本实例的研究疾病是急性气管-支气管炎(痰热阻肺证),有关该疾病的诊断信息,为区别于既往病史信息的采集,将其记录在CE域。需要说明的是,在CDASH中并没有CE域,为了方便数据收集,在建库时分西医诊断和中医辨证2个变量收集原始数据,后期再转换为纵向CE数据集。事件名称需转换为术语,由变量“CEDECOD(源于词典的术语)”收集,西医诊断可以使用国际医学用语词典(MedDRA)中的规范术语,中医辨证可参考《中医临床诊疗术语・证候部分》(GB/T 16751.2-1997)中的术语。见表4、表5。
2.4 病史
MH数据指受试者在试验开始之前的病史,包括一般病史、过敏病史、生殖病史或其他特定疾病的病史。本实例在数据库中采用1个病例多条记录的模式收集MH数据,导出的数据为纵向数据结构,其中以“MHCAT(病史分类)”区分“一般病史”和“过敏病史”(见表6)。“MHENRF(结束状态)”是根据研究参考时期定义病史的结束状态,对于参考时期的定义每个研究可以不同。本实例研究参考时期以人口统计学数据集中的定义为准,即以第1次服药日期作为研究开始时间,结束时间为最后1次服药日期。该参考时期内如果病史未结束,则结果记为“继续”,病史结束日期为“空”;否则,则要记录病史结束日期。
2.5 量表
QS设置的每个问题均有一个特定的数字“得分”,计算这些得分的总和可得到总评分。QS数据可包括但不限于受试者报告的结果及验证或未经验证的调查量表,如汉密顿抑郁量表、阿尔茨海默病评定量表等。
在中医临床研究中一般会收集中医临床症状积分情况,本例在建库时将中医症状观察作为QS域中的一个分类。对于这类标准二维表格式的数据,我们可以直接导出纵向结构数据(见表7采集数据集),转化为SDTM数据集时,我们将变量“QSCAT(量表分类)”赋值为“QSCSO(临床症状观察)”;对于变量“QSTESTCD(问题简称)”尚未形成规范的受控术语,则以模块名称QSCSO加阿拉伯数字的形式表示(见表7提交数据集)。变量“QSDY(研究天数)”描述了从参考日期作为第1日到本次访视量表填写日期的天数,该变量通过量表填写日期与DM域“RFSTDTC(参照开始日期)”的比较而得到。从RFSTDTC每过1 d“QSDY(研究天数)”的值就增加1,往前1 d变量值就减1。
2.6 不良事件
对于AE,和病史的数据采集一样,直接应用SDTM采集,在数据库中采用1个病例多条记录的模式收集数据,导出的数据为纵向数据结构,其SDTM数据集样式见表8。其中,必需变量“AEDECOD(字典编码事件名称)”一般使用MedDRA中的首选语(PT),但中医临床试验中出现的一些不良事件名称如“上火”“潮热”等还不能在MedDRA中找到规范的编码。此外,对于与该条AE关联的实验室检查结果,使用相关记录(RELREC)数据集进行关联,其关系类型(RELTYPE)为一对一(ONE),对该名受试者的关系标识符(RELID)为“A”(见表9)。
2.7 实验室检查
LB域存储CRF采集或来自中心实验室的检查数据。在本实例研究中,为了方便数据的采集,在建库时,将LB域分为几个亚模块,分别采集血常规、血生化、尿常规和便常规数据。在转化为符合SDTM标准要求的数据集时,需要将几个亚模块进行拼接,并将变量“LBCAT(实验室检查种类)”赋值为检查结果对应的亚模块的名称。例如,血常规检查数据对应的LBCAT的结果为“血常规”。另外,对于LB域,除了收集是否在正常值范围内外,还经常会收集“临床意义判定”和“异常解释说明”。但是在CDASH和SDTM中实验室检查域均无该变量,故笔者建库时在LB域中增加变量“LBCLSIG(是否有临床意义)”和“LBCOVAL(异常解释说明)”。在转化为SDTM标准变量时,将变量LBCLSIG记录在LB域补充数据集SUPPLB,变量LBCOVAL记录在注释域(Comment Domain,CO)中,以“RDOMAIN(关联域名)”、“IDVAR(标识变量)”和“IDVARVAL(标识变量值)”将LB域与补充数据集SUPPLB和COMMENTS数据集联系起来(见表10)。
3 讨论
从数据库建库开始引入CDASH和SDTM,具有一些明显的优势[4]。统一的数据收集定义可促进不同项目研究间数据库设计和结构的标准化,使数据直接以上报递交的SDTM格式储存,简化甚至消除了提取数据的再操作,使数据流程更加合理化[5]。但也存在一定缺陷,虽然CDASH是根据SDTM结构建立的数据采集标准,但毕竟二者的目的不同,因此增加了数据库内的映射复杂性。同时由于CDASH优化的线性法要依赖使用的数据库系统,如果其基本表结构对应并不友好的录入界面,还可能会使数据录入过程复杂化[6-7]。
通过实例分析,中医和西医之间其临床研究数据采集并没有太多差异,基本可以按照CDASH或SDTM中的域或变量结构来采集数据。同时,受控术语对于数据标准化亦很重要,CDISC受控术语是一套CDISC开发或CDISC采纳的标准表达(值),适用于CDISC定义的数据集里的数据条目,支持CDISC各个基本标准(如SDTM、CDASH、ADaM和SEND)及所有疾病/治疗领域数据标准对受控术语的需求[8]。目前,在应用CDISC标准的过程中,存在的主要问题是中医临床研究相关标准及其术语的缺乏,包括中医临床症状类量表和具有中医特点的控制术语,如CDISC中合并用药的“剂量单位”“剂型”“给药途径”,应补充中医特有的控制术语,如艾灸一壮(剂量单位),汤剂、散剂、膏方(剂型),烟熏、沐浴(给药途径)。
可喜的是,目前在国家食品药品监督管理总局倡导下已经成立临床试验数据标准化工作指导组,其下设的TCM专业小组对中医临床研究如何实现CDISC标准进行了研究和有益的探索[9]。CDISC标准在中医临床研究中的使用还处于起步阶段,由于对CDISC标准理解的不同,可能会造成数据库的建设和后期转换整理时映射难度和映射结果的差异,例如,有的数据管理单位可能会把研究疾病相关中医临床症状放在事件或干预的“相关发现 (Findings About)”中进行收集。对此,应加强对CDISC标准的学习和研讨,逐渐形成行业内的标准,实现助力数据审评、数据交换的最终目的。
参考文献:
[1] CDISC. CDISC Vision and Mission[EB/OL].[2015-01-28].http:// /CDISC-Vision-and-Mission.
[2] FDA. Study Data Standards for Submission to CDER[EB/OL]. [2015-01-28].http://fda.gov/drugs/developmentapprovalprocess/ formssubmissionrequirements/electronicsubmissions/ucm248635. htm.
[3] 陆芳,高蕊,唐旭东,等.临床研究中的数据管理标准CDISC及其应用前景[J].中国新药杂志,2011,20(24):2400-2404.
[4] 李庚,李晓彦,温泽淮.临床数据交换标准协会标准在中医药临床研究病例报告表设计中的应用[J].广州中医药大学学报,2014,31(1):138- 141.
[5] 黎燕兰,胡镜清,刘保延.CDISC标准与中医药临床研究数据标准化[J].世界科学技术-中医药现代化,2012,14(6):2109-2114.
[6] 董雯雯.CDISC标准在药物临床试验中的应用[D].上海:复旦大学, 2012.
[7] 向楠,邓阿黎,丁晓娟,等.中药新药临床试验病例报告表的标准化及电子化研究探讨[J].中药新药与临床药理,2006,17(4):297-299.
[8] National Cancer Institute. CDISC Terminology[EB/OL]. [2015-01-28].http://cancer.gov/cancertopics/cancerlibrary/ terminologyresources/cdisc.
[9] 王骏,韩景静,黄钦.从药品技术审评谈临床试验的数据标准化[J].中国新药杂志,2014,23(19):2228-2230,2279.
2组间差异有统计学意义(P < 0.05)的临床表现对比可知,有统计学意义的16个变量:热痛、胀痛、脱发、唇甲暗红、疼痛活动后减轻、痰多、活动乏力、动则气喘、肌肤局部发暗、口淡不渴、休息后乏力减轻、凉痛、头晕、阴雨天加重、盗汗、鼻干,均为游走痛组 < 无游走痛组。剩余66个变量之间差异无统计学意义,且其与风邪所致临床表现无关。在409例患者中,有游走痛者102例(25%)。这102例同时满足类风湿关节炎诊断标准,即都存在至少3个关节区持续6周以上的肿胀。肿胀属中医湿邪。结论:游走痛可以作为类风湿关节炎中医风邪的关键指标;类风湿关节炎存在“风湿痹阻”证候,这一证候的患者不超过患者总数的25%。
【关键词】 类风湿,关节炎;游走痛;中医病因;风邪;风湿痹阻证;HFRA数据库;临床研究
Clinical Research on Whether Wandering Pain Being the Key Indicator to Rheumatoid Arthritis Caused by Wind Evil
LI Yuan-wei,ZHANG Zi-yang,LOU Yu-qian
【ABSTRACT】Objective:To investigate whether wandering pain is the key indicator to rheumatoid arthritis caused by wind evil,and to explore the related syndrome.Methods:Four hundred and nine cases with rheumatoid arthritis recorded in the HFRA database(database of Henan Rheumatism Hospital)were divided into the wandering pain group and non-wandering pain group.Software SPSS 19.0 was used to analyze the difference and relationship of articular manifestation and extra-articular manifestation of the two groups.Results:Because there were weak correlations between the original variables in the wandering pain group,it was not suitable for cluster analysis.The clustering results of the non-wandering pain group showed that body numbness and the whole body’s aversion to cold and wind were caused by wind evil or other evils,which couldn’t be the only judging index for wind evil.At the same time,the difference between the two groups was statistically significant(P < 0.05).
The 16 variables with statistical significance were as follows:heat pain,gas pain,hair loss,dark red lip and nails,relief of pain after activity,excessive phlegm,
fatigue,asthma,local dark skin,tastelessness in mouth without thirst,recovering from
fatigue after rest,cold pain,dizziness,aggravation
during rainy days,night sweat and dry nose.These manifestations in the wandering pain group were less serious than those in the non-wandering group.There was no significant difference between the other 66 variables,and the symptoms were not related to the clinical manifestations caused by wind evil.Among 409 patients,there were 102 cases(25%)with wandering pain.The 102 patients met the criteria for the diagnosis of rheumatoid arthritis,that is,there were at least 3 joints in the area that lasted for more than 6 weeks.Swelling belongs to TCM dampness.Conclusion:Wandering pain can be used as the key index to judge the wind evil causing rheumatoid arthritis.Rheumatoid arthritis has the syndrome of rheumatic arthralgia,the number of patients caused by which is less than 25% of the total number.
【Keywords】 rheumatoid,arthritis;wandering pain;origin of diseases in TCM;wind evil;rheumatic arthralgia syndrome;HFRA database;clinical research
风湿关节炎(rheumatoid arthritis,RA)患者有很多重要的关节表现,最常见的有关节肿胀、晨僵[1],
除此之外,游走痛、阴雨天加重等[2]在临床中也经常见到。这些关节表现影响临床辨治,在中医传统辨治过程中有着重要的地位[3],如文献《李中梓治疗痹证学术思想浅析》中就将游走痛作为行痹辨证的关键[4]。查找文献发现,游走痛作为RA风邪的主症是经验性的,未见到证据级别较高的研究,本文就此进行了深入的研究,以探讨游走痛是否为RA风邪的关键指标,并探讨其相关证候。
1 病例来源及诊断标准
本研究的病例来源于河南风湿病医院RA数据库(HFRA数据库)[5],该数据库收录了自2013年
4月至2016年7月在本院就诊的符合纳入标准的409例RA患者的一般资料、关节表现、关节外表现等病证信息。该数据库所纳入的RA患者均采用美国风湿病学会(ACR)1987年颁布的RA分类标准[6]。
2 方 法
2.1 分组与研究方法 将409例RA患者按有无游走痛分为游走痛组和无游走痛组。将2组所涉及的关节表现及关节外表现的频数及构成比分组列表进行比较,并做聚类分析。
2.2 统计学方法 采用SPSS 19.0软件进行统计分析。计量资料符合正态分布以表示,不符合正态分布以中位数与全距表示;计数资料计算构成比,组间比较采用χ2检验;证候分析采用主成分分析、因子分析、聚类分析。以P < 0.05为差异有统计学意义。
3 结 果
3.1 一般资料 游走痛组共102例,男11例,女91例;年龄20~76岁,平均(49.32±10.95)岁;
病程最短2个月,最长32年,中位数3年。无游走痛组共307例,男42例,女265例;年龄17~79岁,平均(49.10±11.71)岁;病程最短
2个月,最长44年,中位数5年。2组患者在性别、年龄、病程等方面比较,差异无统计学意义(P > 0.05),
具有可比性。
3.2 关节表现及关节外表现 HFRA数据库中的409例RA患者,涉及关节表现及关节外表现共88个变量,依统计学要求,样本量为变量的5~10倍,删除频数 < 20的变量,剩余变量为82个,符合要求。2组变量的频数及构成比见表1、表2、表3。
3.3 主成分分析、因子分析、聚类分析 游走痛组KMO和Bartlett的检验可得取样足够的Kaiser-Meyer-Olkin度量值为0.316 < 0.5,Sig值为0.000 < 0.005,表明原始变量之间相关性弱,不适合因子分析的统计学方法,无法进行下一步聚类分析。无游走痛组KMO和Bartlett的检验可得取样足够的Kaiser-Meyer-Olkin度量值为0.602 > 0.5,Sig值为0.000 < 0.005,表明原始变量之间存在相关性,适合主成分分析及因子分析的统计学方法,可进行下一步聚类分析。无游走痛组变量经过相关矩阵分析及最大四次方值法旋转后,选取值 > 0.3的变量,得出31个公因子,将该组得出的公因子采用Ward法 + Euclidean矩阵 + Z得分进行聚类分析。
与临床相结合,无游走痛组以聚7类较为合适,具体聚类结果如下:①F20渴喜冷饮,F28五心烦热、盗汗,F26肌肤局部发暗,F15渴喜热饮、渴不欲饮,F11失眠、多梦,F16凉痛;②F4活动后乏力、月经量少、月经色暗、月经有块,F7头重如裹、发热时间不定;③F10少气懒言、声低,F14僵痛、动则汗出、肢体麻木,F2口干、咽干、口苦、口黏腻,F6活动后加重、活动后减轻、口淡不渴,F9遇冷痛增遇热痛减、阴雨天加重;④F27昼轻夜重、大便稀溏,F30头晕、月经先期,F12眼干、鼻干,F19热痛、动则气喘,F13心慌、胆怯、心神不宁;⑤F29痰多、唇甲暗红,F31沉痛,F18胀痛、酸痛、口唇淡白,F17食后腹胀、肢体浮肿、颧红,F22食冷腹泻、耳鸣,F21劳累后加重、脱发、夜尿频多;⑥F1全身乏力、活动后乏力加重、休息后乏力减轻、神倦懒动、患病后体质量减轻、纳少,F5全身怕风怕冷、畏寒肢冷、四肢不温,F23低热、咽痛;⑦F3生气后加重、心烦、易怒、抑郁,F25闭经、易感冒,F8健忘、视力减退、视物模糊、听力下降、面色萎黄,F24大便黄、小便干。其中刺痛、腰膝酸软、自汗共计3个变量在取消γ系数绝对值 < 0.3后进行旋转成分矩阵后,无相关数据对应,故在此不再对刺痛、腰膝酸软、自汗3个变量进行系统聚类分析后的展示。
3.4 χ2检验 通过对表1、表2、表3中2组相同变量制定四格表资料,并运用SPSS 19.0软件进行数据分析整理,将2组间差异有统计学意义(P < 0.05)
的临床表现汇总,结果见表4。
通过对表1、表2、表3中2组间差异有统计学意义(P < 0.05)的临床表现对比可知,热痛、胀痛、脱发、唇甲暗红、活动减轻、痰多、头晕、阴雨天加重、活动后乏力、动则气喘、肌肤局部发暗、口淡不渴、休息后乏力减轻、凉痛、盗汗、鼻干均为游走痛组 < 无游走痛组。
4 讨 论
游走痛组的原始变量之间相关性弱,不适合因子分析的统计学方法,无法进行聚类分析。从无游走痛组聚类分析结果可看出,②中出现了肢体麻木,⑥中出现了全身怕风怕冷等看似“风邪”的临床表现。临床上,单纯属虚证的肢体麻木有之,但夹风夹寒夹湿夹痰夹瘀者,同样常见。故这里的肢体麻木应该是一个风邪与他邪相兼的症状。全身怕风怕冷不仅有风的表现,同时兼有寒的表现,是一个风寒兼有的症状。由此可以看出,无游走痛组的聚类结果中出现的肢体麻木、全身怕风怕冷均为风邪与他邪相合而致,不能单独作为风邪的判断指标。同时对表1、表2、表3中2组间差异有统计学意义
(P < 0.05)的临床表现对比可知,有统计学意义的16个变量均为游走痛组 < 无游走痛组。剩余66个
变量之间差无统计学意义,且其与风邪所致临床表现无关。综上所述,游走痛可以作为RA风邪判断的关键指标。
从西医角度讲,RA的基本病理为关节滑膜炎,在RA的诊断标准中[6],对称性手关节(近端指间关节、掌指关节、腕关节)至少3个关节区的关节炎且持续6周以上是特征性表现,占权重近1/2。所以,多数学者都将RA关节疼痛描述为持续性疼痛[7-8]。笔者在临床中观察,患者若没有持续6周以上不缓解的滑膜炎(关节肿痛、压痛)存在,很难确诊为RA,即RA患者的某些关节一定是持续性疼痛的;但也发现被确诊为RA的一部分患者,既存在某些关节持续肿痛,又同时存在另外某些关节数日内就能消失的游走性、反复发作性肿痛,暂且将这类患者称为“伴游走肿痛的RA”,这类患者并不少见,本研究显示其占RA患者的25%(102/409)。这类“伴游走肿痛的RA”是RA的一个亚型吗?与回文性风湿病(palindromic rheumatism)有无关联?有待进一步研究。
从中医角度讲,本研究显示关节游走痛是RA风邪的关键指标,这类伴有风邪患者占RA总数的25%,所以,在临证时不能忽视风邪的存在。但一些权威文献如《中药新药临床研究指导原则》等中却完全忽视了风邪的存在[9],这与临床实际不符,建议在今后修订时予以补充。然而,滑膜炎的特征性表现是关节肿胀,肿胀(下转第38页)
(上接第17页)属中医湿邪,笔者前期的研究也表明,RA患者普遍存在“湿”重于“风”的现象[10]。
结果中显示,游走痛组102例患者原始变量间相关性弱,不适合再进行聚类分析,换句话说,这类患者没有必要再进行分类,他们原本就是一类,一类具有游走痛这一共同特征的患者,因此就没有必要将其再分类了。所以,“伴游走肿痛的RA”患者,若将其中的虚象明显者、瘀象明显者、他邪(如寒邪[11]、热邪[12]等)明显者都剥离出来,剩下的则为“风湿痹阻”证。即RA患者应有“风湿痹阻”这一临床证候,这与姜泉、冯兴华的认识一致[13],
然这一证候的数量定少于RA患者的25%。还需要注意的是,风湿病的基本病因病机是“虚邪
瘀”[14],RA也不例外。RA风湿痹阻证只是说这类患者风邪、湿邪较重较多,是患者的主症,其必然还同时存在一些虚象、瘀象和其他邪气,只是这些虚象、瘀象和其他邪气较轻较少,不是主症而已,这些从本文的表1、表2、表3中也可以看出。可将RA风湿痹阻证候定义为:符合RA诊断,伴某些关节游走性疼痛,无明显寒象、热象、瘀象、虚象者。RA的证候极其复杂,除了风湿痹阻证外,还有75%以上的患者,分别属于什么证候?需今后深入探索。
5 参考文献
[1] 娄玉钤.中国风湿病学[M].北京:人民卫生出版社,2010:45-48.
[2] 王钧琴,李国春,周学平,等.类风湿关节炎中医证候量表条目筛选[J].辽宁中医药大学学报,2014,16(3):80-82.
[3] 孙琳,张杰.类风湿关节炎中西医治疗研究进展[J].辽宁中医药大学学报,2013,15(4):129-132.
[4] 雷艳,王新昌.李中梓治疗痹证学术思想浅析[J].黑龙江中医药,2014,44(5):11-12.
[5] 娄玉钤,张子扬,许平英,等.基于病证结合的类风湿关节炎数据库建立及其409例基线资料报告[J].风湿病与关节炎,2016,5(8):5-9.
[6] 中华医学会.临床诊疗指南・风湿病分册[M].北京:人民卫生出版社,2010:3.
[7] 蒋明,张奉春.风湿病诊断与诊断评析[M].上海:上海科学技术出版社,2004:80.
[8] 栗占国.类风湿关节炎[M]//王吉耀.内科学.北京:人民卫生出版社,2005:1054.
[9] 国家食品药品监督管理局.中药新药临床研究指导原则[M].北京:中国医药科技出版社,2002:115-119.
[10] 张子扬,娄玉钤.中医“上肢多风下肢多湿”是否适应于类风湿关节炎辨证的临床研究[J].风湿病与关节炎,2016,5(9):16-19.
[11] 张子扬,娄玉钤.关节遇冷痛增是否类风湿关节炎中医证候寒痹关键指标的临床研究[J].风湿病与关节炎,2016,5(11):25-28,40.
[12] 张子扬,许平英,娄玉钤.关节热痹是否类风湿关节炎中医证候热痹关键指标的临床研究[J].风湿病与关节炎,2016,5(10):16-19,26.
[13] 姜泉,冯兴华.类风湿关节炎[M]//王承德,沈丕安,胡梦奇.实用中医风湿病学.北京:人民卫生出版社,2009:504.
在中国,统计学经过几十年的发展,于2011 年成为一级学科,这标志中国的统计学正进入一个新的全面发展阶段。与此同时,不少人对统计学的一些分支,特别是经济统计学、计量经济学和数理统计学这些学科的定位、作用以及它们之间的相互关系与发展前景的认识并不一致,在某些方面可能存在认识误区,甚至将经济统计学和数理统计学的发展对立起来。这些认识误区的产生,有其历史的原因,也有现实因素的影响。但是,这不利于统计学的发展。因此,有必要厘清统计学科内部分支,特别是经济统计学、数理统计学、计量经济学与经济理论等之间的相互关系及其发展前景。本文的主要目的,是从统计学与经济学统一的视角,论述统计学各个分支,特别是数理统计学、经济统计学、计量经济学和经济理论( 包括数理经济学) 各自的学科定位、作用,以及这些学科之间的相互关系。本文的分析表明,作为现代统计学的一个重要发展方向,数理统计学在中国正在迅速兴起。在经济学中,经济统计学和计量经济学由于与经济理论的密切结合,在量化描述经济现象并透过现象揭示内在经济规律的过程中发挥着重要作用,两者一起构成了经济研究特别是实证研究完整的方法论,其中经济统计学作为测度方法论是经济实证研究与计量经济学的前提条件与基础,有其深厚的学科根基以及广阔的发展前景,不可替代。
作为统计推断的一般方法论,数理统计学的发展不会弱化经济统计学与计量经济学在经济学中的方法论作用,相反地,随着这些学科之间的交叉与融合,经济统计学与计量经济学将得到迅速的发展,从而进一步提升中国经济实证研究的水平与科学性。本文的结构如下: 第二部分分析并论述统计学、概率论、数理统计学、经济统计学、计量经济学以及经济理论( 包括数理经济学) 等学科之间的相互关系,特别是它们的区别与联系。第三部分讨论经济统计学的主要特点,以及其在经济研究与经济管理中发挥的基础性作用。第四部分讨论发展经济统计学的主要途径。第五节是结论。
二、经济统计学与计量经济学等相关学科的相互关系
统计学是一门关于数据的科学,是关于数据的搜集、整理、加工、表示、刻画及分析的一般方法论。统计学就其研究范畴来说,包括描述统计学( descriptive statistics ) 与推断统计学两大领域。描述统计学主要是数据搜集、整理、加工、表示、刻画和分析等,包括概括性的数据处理与分析; 而推断统计学则是基于样本信息,对产生样本数据的母体或系统进行推断的方法论科学。现代统计学的迅速发展有两个主要历史原因,一是各个国家、政府和社会部门基于管理目的搜集社会经济信息的客观需要; 二是数学学科中的概率论的发展。在人类社会中,数据搜集的历史非常悠久,描述统计学特别是数据搜集、整理、描述、刻画与分析的重要作用是不言而喻的。数据的搜集及数据质量本身是任何有意义的数据分析的基础与前提。没有高质量的数据,任何数据分析及其结论将毫无意义。在当今信息爆炸时代,如何用简洁、方便、易于解释的方式,从大量复杂数据中概括其最有价值的信息,也是描述统计学的一个重要作用。
但是,现代统计学的发展及其在自然科学与人文社会科学中很多领域的应用,主要是由概率论的产生与发展推动的。概率论的产生最初主要是对赌博研究的需要,后来成为研究不确定性现象最主要的数学工具,广泛地应用于自然、工程、社会、经济等各个领域。在统计应用中,人们一般无法获得整个母体的信息,而只能搜集到母体的一部分信息,即样本信息,其主要原因是因为获取整个母体信息的成本太高、时间太长或者因为客观原因而无法获得。因此,人们只能从有限的样本信息推断母体的规律特征。在这个推断过程中,概率论对描述样本信息与母体规律特征之间的关系提供了一个非常有用的数学工具; 更重要的是,它对基于样本数据的统计推断所获得的结论能够给出某种可靠性描述。这奠定了推断统计学的科学基础,也是统计推断区别于其他形式的推断( 如命理师根据手相或面相等样本信息推断一个人一生的命运) 的最为显著的特点。
因为这些原因,概率论的发展极大地推动了推断统计学的发展,特别地,概率论提供了很多数学概率模型,可用于对母体的概率分布进行建模。因此,统计推断就转化为从样本数据推断数学概论模型参数值以及其他重要特征等信息。这样,推断统计学就主要表现为数理统计学的形式。数理统计学有两个主要内容,一个是模型参数的估计,另一个是参数假设的检验。经过几十年的发展,数理统计学发明了很多推断理论、方法与工具。这些推断理论、方法与工具能够从样本信息推断母体特征、性质与规律,并提供所获结论的可靠性判断。由于自然科学与社会科学大多是从实验数据或观测数据推断所研究的系统或过程的内在规律,因此,数理统计学被广泛而迅速地应用于各个学科和领域的实证研究。数理统计学之所以成为现代统计学的一个重要的发展方向,就是因为它作为一门严谨的实证研究方法论,符合人类科学探索的过程与需要,即从有限样本信息推断系统或过程的性质与规律。随着中国科学的发展与研究水平的提高,包括人文社会科学在内的各个学科,对实证研究的方法论的需要将与日俱增。
因此,统计学特别是数理统计学今后将得到日益广泛的应用与迅速的发展。描述统计学几十年来也有长足的进展,在包括实验或调查方案设计,数据的搜集、整理以及分析,无论在方法论、调查手段还是工具方面,都有极大改进。数据挖掘作为一门关于数据分析方法与技术的新兴学科,可视为描述统计学的范畴。在描述统计学和推断统计学之间,描述统计学发挥着基础性作用,因为描述统计学牵涉到数据的搜集、解释、整理、测度、表示、刻画与分析,而数据及其质量是推断统计学结论科学性的重要前提和基础。描述统计学在刻画数据特征时所使用的一些统计方法与统计量,也是推断统计学的基础工具。与描述统计学相对应,经济统计学是对经济系统中各个主体、部门、变量和各种经济现象的一种数量描述。经济统计学的本质是经济测度学。经济统计学可视为描述统计学的一个分支,但不是描述统计学在经济学领域的简单应用,而是描述统计学和经济理论的有机结合。前苏联以及中国改革开放前的计划统计,特别是部门统计,就是在社会主义计划经济理论和实践基础上建立起来的。随着中国经济从计划经济模式转为市场经济模式,部门统计乃至计划统计越来越不适用于描述中国经济的实际运行。经济统计学需要经济理论的指导。这其实是著名经济统计学家钱伯海( 1997)在他的晚年将精力从研究经济统计学转向研究社会劳动价值论的主要原因,因为传统社会主义计划经济理论已经落后于中国经济转型以及中国经济统计学发展的需要。经济统计学主要是在描述统计学和经济理论两者基础上发展起来的,具有统计学与经济学双重学科属性。
由于研究对象经济系统的复杂性,经济统计学中量化描述经济现象与测度经济变量的理论、方法与工具,比描述统计学标准教科书所介绍的理论、方法与工具要丰富和复杂得多。这也是经济统计学的魅力所在。同经济学可划分为宏观经济学与微观经济学一样,经济统计学也可划分为宏观经济统计学、中观经济统计学和微观经济统计学。所谓宏观经济统计学就是国民经济统计学,主要是搜集和整理整个国民经济运行全过程的所有数据信息,对包括存量与流量、总量与结构、国内与国外,静态与动态等各种方面进行量化描述与分析。
微观经济统计学也称为企业经济统计学,主要是对企业本身各种经济活动、经济行为、经济现象进行量化描述。以企业财务为主要对象的会计学,在某种意义上是微观经济统计学的一个重要组成部分,即企业财务统计学。所谓中观经济统计学,是指对介于整个国民经济与企业之间的中观部门,如政府部门、产业部门,不同地区的经济活动和经济现象进行以数据为基础的量化描述。与经济统计学密切相关的一门学科是计量经济学。计量经济学假设经济系统是一个随机过程,服从某一客观运行规律; 任何观测经济数据,都是从这个随机经济系统产生出来的。计量经济学的主要任务就是基于观测经济数据,以经济理论为指导,利用统计推断的方法,识别经济变量之间的因果关系,揭示经济运行规律。有关计量经济学的学科定位与方法论作用,可参看洪永淼( 2007,2011),李子奈和齐良书( 2010)。
可以说,计量经济学是推断统计学在经济学的应用,但并不是简单的应用,而是统计推断理论和经济理论的有机结合。
首先,在数理统计学中,统计推断是通过数学概率模型对样本数据建模。在计量经济学中,计量经济模型不仅仅是数学概率模型,其模型设定需要经济理论的指导( 如选择哪些经济解释变量) 。
其次,数理统计学的一些方法论并不能直接用于对经济数据的统计推断,因为经济数据有其特殊性。比如很多高频金融数据,有所谓的波动聚类现象( volatility clustering) ; 在劳动经济学中,很多数据存在所谓的内生性,这种内生性对识别经济变量之间的因果关系造成很大困扰。另外,一些计量经济模型,如宏观经济学和金融学领域的动态资产资本定价模型( Hansen、Singleton,1982),是通过欧拉方程条件矩刻画的,其中经济理论( 如理性预期理论) 并没有假设相关经济变量的概率分布已知。因此,数理统计学没有现成的方法可用于估计、检验这个模型。这就是为什么2013 年经济学诺贝尔奖得主Hansen( 1982)提出广义矩( GMM) 估计方法的原因。
第三,使用什么样的计量经济模型,要由所研究的经济问题来决定。什么时候需要用回归模型,什么时候需要用波动模型,什么时候需要用整个概率分布模型,这并不是由研究者个人随其偏好而定,而是取决于所研究的经济问题的本质。例如,用历史数据研究市场有效率理论以及资产收益率的可预测性时,合适的计量经济模型是时间序列回归模型( 即条件均值模型) 。这是因为预期收益率可由条件期望来刻画( 陈灯塔和洪永淼,2003)。
第四,计量经济学是经济计量模型的推断方法论,包括如何估计参数和进行检验参数假设,判断模型是否正确设定,以及如何进行经济解释。参数假设与原始的经济假说既密切相关又有区别。经济学家关心的是经济理论、经济假说的正确与否,为此必须首先将经济理论和经济假说转化为可检验的计量经济模型的参数假设,然后利用经济数据进行参数假设检验,并解释参数假设检验结果的经济含义。计量经济学建立在经济观测数据的基础上,即建立在经济统计学的基础上。经济统计学对经济变量和经济现象进行量化测度,这些测度首先表现为经济数据。经济数据是计量经济学实证研究的原材料。计量经济学的推断结论的科学性很大程度取决于原材料即经济数据的质量优劣。
绝大多数经济数据是现实经济生活中的观测数据,不能用可控的实验方法获得,因此经济数据的测度具有巨大的挑战性。同时,由于经济观测数据的不可实验性,计量经济学需要一些基本假设,如假设经济系统是一个随机过程,经济观测数据是经济随机系统的一个( 偶然) 实现,经济随机系统满足某种平稳性或同质性条件,等等。这些假设是否符合客观经济现实也会影响计量经济实证研究结论的科学性。对经济变量、经济现象的准确测度,是经济实证研究的先决条件与基础。没有高质量的经济数据,任何经济实证分析及其结论将毫无意义。
与此同时,经济统计学可以揭示、刻画重要经济变量的性质以及它们之间的数量关系,也就是通常说的典型经验特征。这些典型经验特征实际上是经济实证研究与经济理论创新的重要基础与出发点。测度与刻画经济变量的数据特征,包括它们之间数量关系的特征,是经济统计学的范畴。如何更进一步地揭示经济变量之间的因果关系以及内在规律,则需要经济理论与统计推断。经济理论在某种意义上就像概率论一样,可以指导对经济现象的建模。因此,在经验典型特征事实基础上,以经济理论为指导,对经济现象进行建模( 所建模型即为计量经济模型) ,并基于经济观测数据对计量经济模型进行统计推断,从中找出经济变量的因果关系及经济运行规律,并解释经验典型特征事实。这是计量经济学的范畴。可以看出,计量经济学是经济统计学、经济理论( 包括数理经济学) 与数理统计学三者的有机结合,是一个交叉学科。正如著名计量经济学家Goldberger( 1964)指出的,计量经济学可以定义为这样的社会科学: 它把经济理论、数学和统计推断作为工具,应用于经济现象的分析。
随着中国经济学研究从定性分析为主转为定量分析为主,特别是转为实证研究为主,可以预计,计量经济学作为实证研究最主要的方法论,将发挥越来越重要的作用。综上所述,经济统计学和计量经济学有不同的研究对象和研究范畴。经济统计学是对各种经济现象、经济行为和经济主体的一种量化描述,其本质是经济测度学。而计量经济学是在观测经济数据的基础上以经济理论为指导进行计量经济学建模与统计推断,从而检验经济理论和经济假说的有效性与正确性,并揭示经济变量的因果关系和内在经济运行规律。
很明显,经济统计学是计量经济学的重要前提与基础。经济统计学和计量经济学两者结合在一起,构成了经济实证研究的完整的方法论。经济统计学是经济研究的基础方法论,是整个经济研究过程中的一个前置环节。计量经济学的推断方法,包括计量经济学模型的构建( 由经济理论指导) ,模型参数的估计、检验及其经济解释,是经济实证研究的主要内容。1970 年经济学诺贝尔奖得主萨缪尔森曾说过,计量经济学可以定义为实际经济现象的数量分析,这种分析基于理论与观测的并行发展,而理论与观测又是通过适当的推断方法得以联系。换言之,计量经济学是建立在经济理论和经济测度两者基础上的,而经济理论和经济观测又是通过统计推断方法,即通过数理统计学而联系在一起。与经济统计学一样,计量经济学同样具有统计学与经济学两种学科属性,并不是数理统计学的一个分支。以上各个相关学科之间的关系,可用图1 表示。
三、经济统计学的地位与作用
前文分析指出,经济统计学是对经济现象的量化描述与对经济变量的测度,而计量经济学则是在观测经济数据的基础上,以经济理论为指导,结合统计推断,揭示经济变量的因果关系与经济运行规律。经济统计学和计量经济学一起,构成经济实证研究完整的方法论,其中,经济统计学是经济实证研究与计量经济学的重要方法论前提,它起着一种基础性方法论的作用。那么,经济统计学在社会经济管理和经济研究中具体能够发挥什么样的作用呢?
首先,作为经济测度学,经济统计学用数字描绘经济系统的各种经济现象、各个经济主体、各个经济部门、各个经济层面在不同时间的动态立体图景。Samuelson 和Nordhaus( 2000)指出,虽然GDP 和国民经济核算似乎有些神秘,但它们是20 世纪最伟大的发明。如同人造卫星探测地球上的气候,GDP描绘出一幅经济运行状况的整体图形。这种对经济现象的数字描述,为经济学者、政府官员、企业家以及社会公众了解整个经济现状以及进行相关的经济决策,提供了非常有价值的信息。可以说,在现代经济学中,宏观经济学和微观经济学是经济理论的基础,而在经济统计学中,国民经济统计学是宏观经济学的统计版本,企业经济统计学则是微观经济学的统计版本。宏观经济学和微观经济学是对经济系统的理论描述,而宏观经济统计学和企业经济统计学是对经济系统的一种现实描述,以数量的形式描绘了整个经济运行的实际状况。
第二,统计学有一个重要思想,是通过构造简单、方便、易于解释但又具有科学性的统计方法与统计工具,从大量数据中概括其最主要特征与最有价值信息。经济统计通过收集每时每刻都在产生的大量经济数据并且进行分析,从中获取最有价值的信息,这是经济统计的最主要任务与最主要功能。在信息爆炸时代,从海量数据中总结有价值的信息,并及时地以简单、方便、易于解释的方式将信息传递给政府官员、经济学者、企业家、社会公众,这些重要经济信息是政府宏观经济管理与决策、企业微观管理与决策及社会公众了解社会经济现象的重要基础。举几个例子: 第一个例子,各国中央银行的一个重要任务,是控制通货膨胀。根据通货膨胀率的变化趋势,及时调整央行的货币政策,而通货膨胀率,主要是CPI 的测度,其有效性、精确性与科学性是央行制定政策的依据。第二个例子是经济增长率。GDP增长率是政府进行宏观经济决策与经济管理的一个主要目标,是衡量经济发展的一个重要指标。如何测算GDP 是一个重要问题。第三个例子是如何测算中国的人力资本( human capital) ,这也是一个具有挑战性的问题。一段时间以来,社会公众对官方的经济统计数字经常表示质疑,这种质疑一方面表明,中国经济统计学家与经济统计工作者还需要做大量的解释工作和改进工作,另一方面也表明经济统计学知识在中国的普及势在必行。
第三,经济统计学是经济研究特别是实证研究的前提与基础。经济统计学提供的数据质量的优劣,直接影响实证研究结论的科学性。众所周知,经济学研究的最主要任务是通过对所观察到的各种经济现象进行理论思维与理论创新,揭示经济运行规律。经济统计学可以从观测经济数据中找出重要的经济变量之间的数量关系。这些数量关系构成经验典型特征事实。经验典型特征事实是对复杂经济现象的一种概括性刻画,是经济学实证研究与理论创新的重要基础。在宏观经济学中, Phillips( 1958)从英国宏观经济数据中发现货币工资增长率和失业率之间存在负相关的关系,这后来被转化为刻画通货膨胀与失业率之间的负相关关系并称为菲利普斯曲线。菲利普斯曲线作为宏观经济学的一个经验典型特征事实,构成了凯恩斯以后宏观经济学理论发展的基础。所有宏观经济理论都必须能够解释为什么通货膨胀和失业率之间存在负相关关系。上个世纪70 年代,以美国为代表的西方经济陷入了滞涨阶段,菲利普斯曲线变为正斜率,这个新的经验典型特征事实推动了后凯恩斯宏观经济理论的发展。另一个例子,是由Mehra 和Prescott( 1985)提出的所谓证劵风险溢价之谜( equityrisk premium puzzle) ,即美国证券市场收益率远高于无风险债券市场收益率。这一经验典型特征事实,对宏观经济学与金融学领域的资本资产定价理论的发展起着巨大的推动作用。
在微观经济学中,有所谓的恩格尔曲线,即一个家庭消费所占的比例随收入的增加而逐渐减少。这是恩格尔通过微观经济统计数据发现的经验典型特征事实。在金融学方面,早在1960 年代,金融经济学家就发现,股票市场存在波动聚类现象,即今天一个大的波动,明天常常伴随另一个大的波动; 今天一个小的波动,明天常常会伴随一个小的波动,这两种变化交替进行,而不是大小波动均匀分布。2003 年经济学诺贝尔奖获得者Engle( 1982)提出的著名的ARCH 波动模型之所以流行,一个重要原因是它可以解释金融市场波动聚类这个重要经验典型特征。在中国,引起中国经济学者、政府官员和社会公众关注的很多重要经济问题,其实都有经济统计学的贡献。
例如,经济学家在分析中国经济统计数据过程中发现,劳动收入在整个国民经济收入中所占的份额在过去近20年中逐步降低。这个经验典型特征事实成为一段时间以来中国经济学者的热门研究课题。中国经济研究特别是实证研究水平的提升,关键就是要能够在细致、准确地搜集与分析中国经济数据的基础上,总结反映中国经济在转型期的经验典型特征事实,在此基础上提出经济转型理论解释中国经济的运行及发展趋势,并运用计量经济学方法验证经济理论的有效性。如果中国经济学能够遵照这种研究范式,那么中国经济学的研究水平将得到很大提升,并对经济转型理论做出自己创新性的贡献。但是,目前中国经济统计学家、计量经济学家和经济学家在总结中国经济经验典型特征事实方面,做得还很不够,对重要经验典型特征事实在经济研究与理论创新过程中的作用与重要性,也认识不足。
第四,经济测度对计量经济学的学科发展有重要的推动作用。首先,经济测度的质量决定了计量经济学实证分析结论的科学性。其次,经济数据,特别是经济数据的类型,对计量经济学学科发展影响巨大。举几个例子: 首先是经济数据观测的误差( measurement errors) ,对计量经济学的推断,包括参数估计和参数假设检验,有很大的影响,如导致不一致的参数估计。为了研究测度误差的影响,计量经济学很早就有了一个分支,即变量误差的计量经济学。当然,变量误差也可能由其他因素而非测度误差引起。第二个例子是时间序列计量经济学的发展。Nelson 和Plosser( 1982)在一个实证研究中发现,绝大部分宏观经济时间序列,包括GDP、CPI和股票价格,都是非平稳时间序列。这对当时以平稳时间序列作为主要研究对象的时间序列计量经济学提出了挑战,因为平稳时间序列计量经济学的理论与方法,不适用于分析非平稳时间序列。
后来的单位根和协整等现代时间序列经济学理论,就是为了研究非平稳时间序列而发展起来的。第三个例子是不完全识别计量经济学( partialidentification econometrics) 。在微观经济数据中,有一些经济变量不能获得精确测度,比如在美国问卷调查一个人或家庭收入时,因各种原因只能调查收入处于哪个区间,不能获得一个精确测度。这种不精确经济测度,对计量经济学实证研究造成了很大影响。特别地,在估计计量经济模型参数值时,不能获得点估计,只能得到区间估计。这种统计推断的方法催生了一个新的计量经济学分支,即部分或不完全识别计量经济学。第四个例子,在大数据时代,各种以前没办法获得的数据,现在通过现代信息技术可以得到,比如在金融市场,可以获得每笔交易数据,即tick by tick data,每次交易的价格、交易量以及交易的时间点,都可以完整地记录下来。这种新型的交易数据,包含很多交易行为和市场微观结构的信息。除金融市场外,超级市场或商店通过信用卡完成的交易,其交易以及交易者的信息,也同样可以获得。对这种实时交易数据进行计量经济学建模及推断,产生了一个新的计量经济学分支超高频数据计量经济学( econometrics ofultra-high frequency data ) 。更多讨论参见Engle( 2000)和Engle Russell( 1998)。
最后一个例子是面板数据。以前大部分经济数据,要么是时间序列数据,要么是横截面数据。现在,越来越多的二维数据,即对每个横截面单位( 如个人、家庭、国家等) ,可以在不同时期跟踪并测度。这种二维数据称为面板数据。一个很著名的例子,是美国密歇根大学PSID 调查数据。这个数据库调查了很多美国的个人和家庭,而且在不同时期跟踪测度,对研究美国劳动力市场与收入分配发挥了重要作用。这种数据推动了面板数据计量经济学的发展。实际上,不仅是面板数据,现在也可每天观测到一个曲线,如IBM 股票价格每天从开盘到收盘随时间变化的曲线,又如不同城市每天温度随时间变化的曲线,这些在统计学上称为函数数据,有相应的统计模型,更多讨论参见Ramsey 和Silvema ( 2005)。上面几个例子表明,数据的类型,即经济测度的类型,在很多方面都推动了计量经济学学科的发展,这其实是经济统计学对计量经济学发展的影响和重要贡献。第五,一个多世纪前,有一位美国学者说过,统计思想与统计思维总有一天会和要求一个人能够读、写一样,是一个人在现代社会中所具备的基本能力。培养大量具有经过系统训练的经济统计人才,对完善一个国家的治理体系与提高治理能力是非常重要的。中国经济统计学的一个重要任务就是培养大量高素质、具有系统的经济统计学训练的专门人才,推动中国市场化经济转型、提高宏观与微观经济管理水平,提高国家社会治理水平。尤其是,现代社会是信息爆炸的社会,需要培养大量懂得搜集数据、分析数据、解释数据、基于数据进行决策与管理的经济统计人才
四、如何推动经济统计学的发展
如何在新的历史条件下提升与发展经济统计学?第一,坚持经济统计学是经济测度学这个基本学科定位。经济统计学用数字描绘各种经济现象、各种经济主体、各个经济部门和各个不同层次在不同时间的动态全景图像。经济统计学的最主要任务是经济测度方法论的创新,发展能够更精确地测度经济现象、经济行为和经济变量的理论方法与工具,并应用于实践。这个基本定位将保证经济统计学在经济学中的基础地位,从而不会受到包括数理统计学和计量经济学在内的其他相关学科在中国兴起的可能冲击与影响。一些学者曾提出广义经济统计学的建议,将作为推断方法论的计量经济学作为其中一部分。
这种想法符合统计学的范畴定义,即如统计学分为描述统计学和推断统计学那样,经济统计学也可分为经济测度学和计量经济学。然而,由于历史的原因,计量经济学作为一个学科在国外已有80 多年历史,在中国也有30 多年发展历史。如果将计量经济学作为经济统计学的一个组成部分,有可能会出现计量经济学取代经济统计学的情形。因此,坚持经济测度学的基本定位可以更加明确经济统计学的学科特色,有利于经济统计学的长远发展。在这方面,邱东( 2013)对国民经济统计学科的定义与内涵、外延发展,做了精确阐述。
事实上,在国外,经济统计学主要也是定位在经济测度学方面。第二,发展经济统计学必须立足本土化。在中国,经济统计,特别是现代统计学意义上的经济统计,历史不是很长。中国地大物博、不同地区之间、城乡之间与不同群体或阶层之间差异巨大,经济统计不但水平较低,而且面临的挑战与困难也特别巨大。这种基本国情为在中国发展经济统计学提供了一个很大的空间,比如,关于宏观经济数据的构建,一个重要问题是处理季节性因素。在西方的经济统计工作中,季节性因素对经济变量的影响,比如感恩节、圣诞节、元旦等等,其处理都有一套成熟的方法,但是这些方法并不完全适合一些具有中国特色的季节性因素。比如中国的端午节、中秋节、春节,都是根据中国农历而定,而不是根据西方公历而定的季节性因素。这些季节性因素的处理方法将与国外季节性因素的处理方法有所不同,这是中国特色。
又如,中国在过去30 多年,成功地从计划经济模式转为市场经济模式。但是,与西方发达国家相比,中国市场经济发育、成熟的程度还比较低。中国经济统计学家能否提出一套刻画中国市场经济发展成熟程度的指标,以测度中国市场经济完善的程度? 还有,中国过去30 多年,以要素投入为主要特征的粗放型经济增长模式已经面临一个转折点。中国经济必须经济转型,以确保持续稳定发展。对中国过去30 多年粗放型经济增长模式所带来的一些不可持续的因素制约,如对环境污染的经济成本,在统计方法上还没有一个系统的、有说服力的量化描述与估计。最后,中国正处于实现以民族复兴、人民幸福为主要内容的中国梦过程中,对中国梦的量化指标的构建,包括对人民幸福感指数的构建,也是中国经济统计学家,计量经济学家与经济学家可以做的具有理论与现实意义的研究工作。总之,立足本土、立足国情、服务国家社会经济发展需要,将使经济统计学焕发出巨大的发展活力。第三,大力促进学科交叉与融合,通过学科交叉与融合,推动中国经济统计学的发展与现代化。上文在描述经济统计学的重要作用时,讨论了经济统计学对发展其他学科,特别是计量经济学的重要作用。同样地,包括经济理论、计量经济学、概率论与数理统计学在内的其他相关学科的发展,对发展经济统计学也有很大的推动作用。前面提及,著名经济统计学家钱伯海在他的晚年,集中精力从事社会劳动价值论的研究,他从经济统计学研究中深深感受到要发展经济统计学,特别是国民经济综合平衡核算体系,必须有新的经济理论作为指导。作为经济测度学,经济统计学不可避免地涉及到统计抽样调查。
在这方面,数理统计学特别是抽样理论的最新发展可以提供很大帮助。在国民经济统计学中,对宏观经济变量的测度,以及对宏观经济变量之间数量关系的描述及解释,也需要经济理论的指导。宏观经济变量是微观经济变量在一定时期内的加总( aggregation) 。由于微观个体的异质性,加总以后的宏观经济变量的性质,以及宏观经济变量之间的数量关系,与原始的微观经济变量以及它们之间的关系可能有很大的不同。在微观经济学中,一个著名的例子,就是需求函数,即微观个体需求与个体收入之间的关系,如果对微观层面个体的需求函数加总,所获得的总需求与总收入之间的关系与原来个体的需求函数将有所不同,除非微观个体消费者的效用函数满足所谓的hypathetic utility function 假设。由此可以看出,对宏观经济变量的测度( 类似加总) 之后,如何理解宏观经济变量的性质以及它们之间的数量关系,需要有微观基础,而这就涉及到经济理论。另一方面,概率论与数理统计学对理解宏观经济变量的性质也是很有助益的。例如,Granger( 1980)讨论了微观消费函数的加总问题。他假设个体之间的边际消费倾向系数有所不同,而且微观个体的边际交易倾向的数值可视为是从 分布中产生的实现。
加总以后的宏观消费变量与原始个体消费变量的统计性质将出现本质区别: 虽然微观个体的消费是一个短记忆的时间序列,但是加总以后的宏观消费变量将具有长记忆( longmemory) 的时间特性。总之,推动各个统计学科的交叉与融合将促进各个学科的发展,包括经济统计学。不管是计量经济学、经济统计学或是数理统计学,这些相关学科都有它们共同的基础,即统计思想与统计思维。因此这些学科完全能够在互相交叉融合中不断完善。同时,也有可能因此产生一些新的交叉学科。例如,实验产生的数据与现实观测经济数据有很多不同特点。特别地,经济观测数据是各种因素联合作用的结果,而且具有不可实验性( 即不能通过重复实验获得) ,因此一般情况下没有办法将其中某一或某些因素所产生的经济后果准确地分离测度出来。而实验经济学则借鉴自然科学的研究方法,通过控制实验条件排除其他因素的影响,从而可以较精确地测度所关注因素所产生的后果。实验经济学实质上是通过可控实验改进经济测度,从而可以更好地研究经济行为与经济规律,包括经济因果关系。
事实上,实验经济学与经济测度学及计量经济学的交叉与融合,正在产生一个新的交叉学科,即实验计量学( experimetrics)。第四,为了发展经济统计学,必须大力推动国际化,通过国际化推动经济统计学的发展。在中国,经济统计的历史相比西方国家短得多,特别是中国社会主义市场经济的实践只有30 几年历史,而西方成熟的市场经济已有几百年历史,我们在统计资料搜集、统计方法与工具等各个方面,还有较大差距。上个世纪70、80 年代,中国国家统计局和厦门大学合作,提出了中国国民经济核算体系,这是西方经济统计学、现代经济学和中国经济实际相结合的一个范例。今天中国的经济统计学同样可以从国外相关学科学到很多有益于自己学科发展的知识。例如,众所周知,GDP 大体反映了一个经济体社会财富水平。但是GDP 作为描述经济发展的指标,有很多缺陷,既不能精确地反映总量,也不能反映经济活动的质量与效益,更不能反映经济结构、社会分配、民生改善、以及对环境破坏的程度等等。
认识到GDP 的种种缺陷,国外学者,包括经济统计学家、经济学家,过去几十年提出各种指标,试图修正GDP 的缺陷,比如Nordhaus 和Tobin( 1972)提出了去除环境污染和交通堵塞等成本的净经济福利指标; Repetto等( 1989)提出了扣除资源损耗成本的国内生产净值; Daly、Cobb( 1989)提出了将财务分配状况、社会成本等因素计算在内的所谓可持续经济福利指标; Pinter、Hard( 1995)提出可持续发展指数; VonWeizsacker 等( 1997)提出了绿色GDP 概念,等等。这些对构建适合刻画中国宏观经济增长与发展水平的指标都有很好的借鉴意义。第五,必须顺应时展潮流,与时俱进地发展经济统计学。我们正处于一个大数据的时代,大数据提供了极其丰富的信息。如何有效地获取大数据中的有用信息,统计学无疑提供了非常重要的方法、理论与工具。与此同时,大数据也为包括经济统计学在内的统计学等分支学科的发展提供了一个新的广阔空间。例如,包括跨境电商在内的电子商务,正在中国蓬勃兴起,深刻地影响了贸易、购物、消费乃至生产形态。如何统计电子商务成为一个迫切需要解决的现实经济统计问题,这也为经济统计学的发展提供了一个难得的机遇,又如,大数据使得以较高频率测度宏观经济变量成为可能。目前绝大多数的宏观经济变量( 如CPI) 最高频率只有月度数据,在大数据条件下,完全有可能获得更高频( 如每周) 的宏观经济数据,这样可更及时反映客观经济运行情况。第六,加速经济统计学教材更新换代,尽可能地全面反映几十年来中国乃至世界上经济统计学和现代统计学的研究成果。在国外,不论是统计学还是经济学相关专业,大都没有经济统计学课程设置,因此也就没有相应的教材。这与宏观经济学、微观经济学、计量经济学等其他经济学课程有很大不同。因此,中国经济统计学教育必须更加注重教材建设,在明确学科定位的基础上,总结国内外各个相关学科以及经济统计的理论与实践,尽量汲收国内外所有有用的研究成果与经验,争取使经济统计学的研究与教育不但成为中国经济学教育的一大特色,同时也成为引领世界前沿研究的国际化学科。
五、结论
本文从统计学和经济学统一的视角出发,分析论述了现代统计学若干分支,特别是概率论、统计学、描述统计学、数理统计学、经济统计学、计量经济学以及经济理论( 包括数理经济学) 之间的内在联系,包括它们的区别与联系,以及发展前景。分析表明,统计学的这些相关学科,各自定位非常清晰,在各自学科发展方面,都有自己不可替代的发展空间。其中,经济统计学既是统计学的分支,也是经济学的分支,是统计学与经济学结合的交叉学科,具有统计学和经济学双重学科身份。经济统计学本质是经济测度学,是经济测度的方法论,是经济学实证研究的前提与基础。这是经济学其他任何相关学科,包括计量经济学,经济理论,数理经济学等无法替代的;也是统计学的其他相关学科,包括数理统计学无法替代的。
随着中国自然科学和社会科学的发展,作为推断方法论的数理统计学与计量经济学,因为有日益增加的需求而得到迅速发展。作为从样本数据推断母体特征的一般方法论,数理统计学因为符合科学研究与探索的过程与需求而在自然科学和社会科学很多领域有广泛的应用。作为经济实证研究的推断方法论,计量经济学在中国过去30 多年来有了巨大的发展。在《经济研究》、《统计研究》、《管理世界》等国内顶尖学术期刊,可以看到大量应用计量经济学理论与方法的实证研究,而专门研究经济测度的经济统计学的文章的数量则相对减少,这主要是因为经济实证研究对推断方法论日益增加的需求。计量经济学方法的大量使用,显著地提升了中国经济实证研究水平与规范程度。
目前,很多研究人员对影像资料分析方法的学习和理解存在一定困难,尤其初学者对繁杂的概念、复杂的计算公式、数据资料性质判断以及如何选择合适统计学方法等问题难以深刻理解。针对这些问题,王良等[1]建议采用以下模式:判断资料类型、根据研究目的选择分析方法、其他适宜方法。
1.1根据资料类型初步确定方法
临床研究中产生的各种不同原始资料,而不同数据资料类型采用的统计分析方法也不同。定量资料常用的方法有t检验、方差分析、非参数检验、线性相关与回归分析等。定性资料可用的方法有χ2检验、对数线性模型、logistic回归等,影像医师可根据不同需要选用不同统计方法。值得一提的是有些资料类型确定后,统计方法的选用对其有序性有相应要求;而多种方法联合应用或者使用部分少见的分析方法时还需要在选定统计方法后,利用统计软件(如SAS、SPSS)对应的不同命令进行初步分析试验。
1.2根据研究目的选择方法
1.2.1差异性研究
差异性分析是指评价比较组间均数、频数、比率等的差异。根据研究需要可选用的方法有χ2检验、t检验、方差分析、非参数检验等。临床上研究两组、多组样本比率或构成比之间的差别关系时最常用χ2检验,也是针对计数资料进行假设检验的一种常用的统计学方法,而对两组定量资料分析常用t检验和秩和检验,多组资料分析则常用方差分析;Fisher精确概率法主要适用于总体样本频数小于40或四格表中最小格子T值<1。虽然Fisher精确检验不属于χ2检验,但仍可以作为有效的补充,而也有人认为在统计软件普遍易得的当下,Fisher精确概率法也同样适用于大样本四格表的资料。如彭泽华等[6]在探讨冠状窦-左心房肌连接的双源CT冠状动脉成像(DSCTCA)形态特征时针对冠状窦-左心房肌连接的类型在两组类别变量采用联表的χ2检验,结果差异无统计学意义(χ2=0.115,P=0.944)。Teefey等[7]在研究超声表现及白细胞计数预测急性胆囊炎坏疽变化关系时使用Fisher精确分析。t检验适用于两组定量资料分析且资料满足方差齐性和正态性两个基本条件;同样t检验适用于完全随机设计的单因素两水平的资料,在选用t检验时应注意对资料进行相应的变量变换,若资料不能满足基本条件则选用适合分析偏态分布的非参数检验(如:秩和检验)进行分析。如Wang等[8]在研究不同侵袭性的前列腺癌组织和正常前列腺组织以及外周带前列腺癌Gleason评分与肿瘤信号对比时采用t检验。Kung等[9]在研究化脓性髋关节炎的临床和放射学预测指标时也使用t检验分析。秩和检验包括基本秩和检验(Wilcoxon等级检验、Mann-WhitneyU-检验)和高级秩和检验(Kruskal-Wallis、Friedmantests、Kolmogorov-Smirnov拟合检验)。当研究资料为两方差齐且呈正态分布的总体,而总体分布类型未知或者不满足参数检验的条件时,采用t检验对样本进行比较;但若无需比较总体参数只比较总置的分布是否相同且总体资料分布类型未知时需要采用非参数的Wilcoxon秩和检验进行比较。针对两组或多组样本的定性资料使用秩和检验比较时,需要混合两样本数据、编秩(从小到大)、计量T值、查表或计算求得P值。如Saindane等[10]在对“空蝶鞍”的临床意义判定因素研究中针对颅内压增高和偶然发现空蝶鞍患者两组资料对比时采用Wilcoxon秩和检验。Filippi等[11]在研究DTI测量儿童Ι型神经纤维瘤病胼胝体派生指标时运用Wilcoxon秩和检验。事实上在影像资料分析中经常见到多重组间比较的情况,方差分析(analysisofvariance,ANOVA)就是用来推断两个或者多个总体之间是否有差别的检验,又称F检验。多重组间比较不能单纯选用两样本均数比较的t检验,但是可以根据资料类型选用ANOVA检验。若来自两个随机样本资料呈正态分布且方差齐性同的定量资料,应采用两因素(处理、配伍)方差分析(two-wayANOVA)或配对t检验。通过F检验可以比较可能由某因素所至的变异或随机误差,同时可了解该因素对测定结果有无影响。当不满足方差分析和t检验条件时,可对数据进行变换或采用随机区组设计资料的FriedmanM检验。Obdeijn等[12]在研究乳腺术前MRI能减少术中切缘和乳腺保守术后再次手术,使用ANOVA分析两组资料,结果对照组(29.3%)相比术前MRI病例组(15.8%)有效减少切缘和再次手术(P<0.01)。
1.2.2相关性分析
相关性分析不等同因果性,也不是简单的个性化相比,其涵盖的范围和领域较为广泛。统计学意义中的相关性分析包含相关性系数的计算,其过程为:每个变量转化为标准单位后,乘积的平均数即为相关系数。相关性分析可以用直观地用散点图表示两个或者多个变量的离散,当其紧密地靠近于一条直线时,即变量间存在很强的相关性。相关分析常用的方法有Pearson相关性分析、Spearman等级相关分析和卡方检验。临床中对两个或者多个均为定量变量的资料,且变量均呈正态分布时可选用Pearson相关分析,但多数情况下Pearson相关分析适用于两组资料的相关性分析。判断两变量之间线性关系的密切程度主要用Pearson积差相关系数,其范围为-1~+1。若相关系数的绝对值越接近1,即两变量间相关性越密切;反之,相关系数的绝对值越接近0,其相关性越差。实际上在高质量期刊论文中使用Spearman等级相关分析的研究也很常见,其通过相关系数进行变量间线性关系分析来判定两个变量间相关性的密切程度。而密切程度的量化指标则通过计算样本相关系数r,根据实际计算r绝对值所属范围来推断两个来自总体变量的线性相关程度,从而推断总体的相关性。根据实际分析需要,将相关关系密切程度分为6等:当IrI=0时,说明两变量完全不相关:当0<IrI<0.3时,说明两变量不相关;当0.3<IrI<0.5时,说明两变量低度相关;当0.5<IrI<0.8时,说明两变量显著相关;当0.8<IrI<1说明两变量高度相关:当IrI=l时,说明两个变量完全相关。王效春等[13]在研究磁敏感加权成像与动态磁敏感加权对比增强MR灌注加权成像联合应用在脑星形细胞瘤分级中的价值一文应用Spearman等级相关分析,结果显示肿瘤内磁敏感信号与相对血容量最大值和病理分级呈正相关(IrI分别为0.72、0.89,P值均<0.01),相对血容量与病理分级呈显著正相关(r=0.78,P<0.01)。又如Lederlin等[14]在比较几何参数、相关功能与组织学特性在哮喘患者的支气管壁CT衰减性关系中同时使用Pearson相关分析和Spearman等级相关分析,其r=0.39~0.43,表明与对照组相比常规CT衰减参数在哮喘患者平常支气管的CT参数、气道壁衰减方面更好的区分哮喘患者,同时也更好地区分气道梗阻。值得提及的是对资料有序或无序无法作出初步判定,且明确资料类型为定性资料时还可以选择使用卡方检验和Spearman等级相关分析。
1.2.3影响性分析
由于事物之间的联系是多种多样的,而某一结局可能受到来自其他多个方面的影响,此时为分析某一结局发生的影响因素可采用的资料分析方法有线性回归(一元或多元)、logistic回归、Cox比例风险回归模型(生存分析)等。在影像资料分析中一元线性回归是将影像资料中一个最主要影响因素作为自变量来解释因变量的变化。多元回归定义为某一因变量的变化受多个重要因素的影响,而此时需要用两个或多个影响因素作为自变量来解释因变量的变化,且多个自变量与因变量之间是线性关系(多个因变量之间相互独立)。实际研究中多元线性回归模型在影像资料分析应用较为广泛。Langkammer等[15]在磁敏感系数绘图在多发性硬化中应用研究中使用多元线性分析,结果显示各种影响因素中年龄是预测磁化率影响最强的因素。Logistic回归是研究二分类和多分类观察结果与某些影响因素自己建关系的一种多变化分析方法,其经常需要分析疾病与各影像指标之间的定量关系,同时又需要排除一些混杂因素影响。Logistic回归在统计学上属于概率型非线性回归,其分析思路与线性回归大致相同,能有效解决过高或过低水平因素以及分析因素少而样本量大等问题。相比多元线性回归,Logistic回归在处理分类反应数据方面更为常用,且适用于结局为定性影像资料。如Lee等[16]研究高分辨率CT在发现小蜂窝样特发性间质肺炎纤维化的连续变化和预后应用中使用logistic回归分析,结果表明高分辨率CT在网状和磨玻璃状范围内评价普通肺炎与非特异性纤维化肺炎之间差别明显(P<0.01)。在临床实际工作中常常需要分析生存时间与影像资料之间的关系,Kaplan-Meier法就是常用的一种分析方法,其又称乘积极限法,对大小样本资料分析均适用。实践中习惯上以时间为横轴、生存率为纵轴回执的阶梯状图称为Kaplan-Meier生存曲线(survivalcurve),也称K-M曲线。Cox比例风险回归模型是另一种生存分析方法,包括参数与半参数模型两类,其主要是进行多因素生存分析的一种方法,同时可分析众多变量对生存时间和生存结局的影响。Saad等[17]在经颈静脉肝内门体静脉分流术在肝移植受者的技术分析和临床评估研究中比较成功施行肝移植与非移植病人开展门体分流术(transjugularintrahepaticportosystemicshunt,TIPS)后的临床疗效评估,使用了Kaplan-Meier法,结果显示6~12个月、12~24个月、24个月以上,移植成活率分别为43%、32%和22%。生存期大于1年的晚期肝脏疾病模型存活评分低于17分、等于17分或大于17分的存活率分别为54%和8%(P<0.05)。
2其他适用方法
2.1ROC曲线
ROC(receiveroperatingcharacteristic)曲线是欧美影像学期刊中应用较为常见的统计学方法,国内期刊应用相对较少。ROC曲线根据一系列不同的分界值以真阳性率(灵敏性)为纵坐标,假阳性率(特异性)为横坐标绘制的曲线。ROC曲线分析结合灵敏度(sensitivity)和特异度(specificity)广泛应用于医学诊断,也应用于影像诊断及人群筛查。ROC曲线根据曲线下面积(areaundertheROCcurve,AUC)的大小对诊断试验作定量分析。理论上,AUC值在0~1间。根据实际情况将诊断分为不符合诊断(AUC<0.5)、无诊断价值(AUC=0.5)、低准确性(0.5<AUC<0.7)、一定准确性(0.7<AUC<0.9)、较高准确性(0.9<AUC<1),AUC越接近于1,表明诊断准确性越高。Hyodo等[18]在研究乏血管少结节的慢性肝脏疾病患者发展成富血管性肝细胞癌风险因素一文中使用ROC曲线分析,结果显示后续发展成血管性结节平均增长率明显高于非血管过渡性结节。
2.2Kappa检验
Kappa检验主要用于评价不同资料间一致性程度,常用Kappa值评价一致程度。Kappa系数适用于两项和多项无序分类变量资料。在影像学试验中常需要判断多名医师测量同一研究对象或者同一医师多次测量同一对象的一致性,Kappa一致性检验便是最佳选择。Kappa检验还可通过计算Kappa值对两种非金标准的诊断方法进行诊断结果一致性分析。一般而言,评价Kappa一致性需要计算Kappa系数,但在研究考察新的诊断试验方法是否优于金标准,或者检验是否与金标准一致时,还需要计算特异度、灵敏度、阳性预测值和阴性预测值等指标。目前公认的Kappa系数分为六个区段即一致性极差(Kappa值<0),一致性微弱(Kappa值0~0.2),一致性弱(Kappa值0.21~0.40),中度一致Kappa值(0.41~0.60),高度一致(Kappa值0.61~0.80),一致性极强(Kappa值0.81~1.00)。
2.3Levene检验
近年来,用户研究已经成为产品设计界的重要研究手段,在产品的进入期、成长期、成熟期甚至衰退期,用户研究都起着至关重要的作用,它可以帮助产品概念的具体化、合理化地符合用户需求,提品功能定义的依据,等等。归根结底,它起到了从用户的需求域(感性描述)到设计的功能域(物理要素)的转换作用,最终帮助设计者获得成功产品所需的要素。
在用户研究的领域里,我们已经有了较为科学的方法来获得需求域中的各类信息数据,而如何将这些信息数据转换成为我们所需要的设计要素则成为研究的重点和难点。用户的需求来源于人,而产品的功能赋之予物,我们需要找到一种方法来发掘这主客体之间的联系,定性定量分析毫无疑问是解决这一问题的必要方法。
二、统计学:定量与定性研究结合
与其他产品设计的单一研究方法不同,在用户研究中,定性与定量分析一般而言是相辅相成的,这样做很好地结合了两种分析各自的长处。定量分析能够发现某个存在的现象,具有很好的说服力和可信性,是对事物“量”的分析,主要通过数据收集和分析来完成。定性研究则可以发掘隐藏在现象底下的规律及原因,具有能够抓住本质的深刻性和高效性,是对事物“质”的分析,主要通过常识、感觉、经验等主观因素来参与分析。
在用户研究中可以直接获取的数据很少,因此定量分析没有施展的空间,并且对于一些感性问题,例如用户的需求、用户的感觉等同样也无能为力。定性分析则受主观因素影响较大,具有不确定性的特点。如何能够很好地发挥定量分析的可信度与定性分析的深刻度是我们所要解决的下一个问题,这里引入统计学的分析方法,将定量与定性分析结合起来。
三、用户研究中的统计学
统计学广泛运用于生物、化学、心理学、社会学、经济学等诸多领域。它被用来了解与测量系统变异性,程序控制,对资料作出结论,并且完成资料取向的决策。而它的这些用途特点非常适合集心理学、社会学、人类学等多门学科交融的用户研究,因此,我们可以通过引入统计学的方法,来对用户研究中获取的信息进行定量和定性分析,从而完成需求域到功能域的转化。
根据统计学的研究特点,我们将其在用户研究中的运用步骤分为信息获取、信息处理、数据分析、数据校验四个步骤。
1.信息获取
用户研究方法有很多,现大多已趋于成熟。我们在确定研究目的与目标的前提下,有意识地选择用户研究的方法,并且明确其输出的数据及形式,为今后的分析做准备。在用户研究中我们可以通过背景资料收集、问卷调查、用户观察、用户访谈、用户角色和用户情境等方法获得大量的文字数据、图像数据、问卷数据、实验数据和语音数据,这些数据都可以通过进一步的处理,转换成统计学中可以运用的数据形式。为了更好地进行下一步的分析研究,要根据用户研究对象的特点将这些信息分为用户基本数据、用户行为数据和用户主观数据。
基本数据主要是指对用户的性别、年龄、职业、收入、教育、地区、家庭结构、生活方式等量化后的数据;行为数据是指用户与产品的交互,即对于产品的使用及体验通过观察测试等方法提取的数据;主观数据是指用户对于产品的满意度、情绪反应、审美反应、生活态度等通过问卷访谈等方式获得的数据。由此我们便获得了计算所需的数据。
2.信息处理
上面我们已经论述了信息获取的方法及信息的分类和特点,但是这些信息的形式如文字、图像、问卷大多都不能直接用于统计学的分析,因此我们要对信息进行处理,也就是信息的量化。
(1)用户基本数据量化
基本数据都属于某种“品质”或“属性”,它们的量化方法可以使用取值为“1”或“0”的人工变量来表示是否存在,也就是对质的因素的判断。如“1”表示已婚,“0”表示未婚。同样有时本身是“数量”因素也可以转化成“质”因素,如“1”表示年收入5万到10万,“0”表示年收入5万以下。
(2)用户行为数据量化
用户行为数据可以通过试验器械的辅助,有计划的观察与测试来获得。主要是行为过程中存在的与衡量目标完成情况相关的变量。这些具体数据的情况与目标有着直接关系,通常可以直接获得具体数值。如时间、频率、数量、周期、步骤等。
(3)用户主观数据量化
用户主观数据主要通过对用户的问卷与访谈得到,是从用户的主观因素出发对用户体验进行量化。在这里,我们可以用数值来表示主观因素的程度,通过这种方法来量化这些主观的、抽象的、感性的信息。如满意程度可以由-3,-2,-1,0,1,2,3这7个数值表示,-3为最不满意,3为最满意。同理抽象感性词汇可以选择一对反义词作为两极,由负值到正值表示符合的程度。如传统和现代、圆润和尖锐等。
此外,为了消除数据计量单位不同的影响,便于数据的直接比较,要对数据进行标准化——使数据矩阵式中每列数据的平均值为0,方差为1;或者规格化——将每列的最大数据变为1,最小数据变为0,其余数据取值在0~1之间。
3.数据分析
在对数据进行必要的处理以后我们就要开始进行统计分析。为了便于介绍统计方法,我们先将处理好的数据分类。在统计学中根据变量数学性质的由低到高可将其划分为:定类数据、定序数据、定距数据和定比数据。定比数据使用较少,此处略。定类数据是一个分类体系,通常将研究对象属性分类后编号,其只能测量类别差。如华中、华北、华东等。定序数据多了类别间顺序等级的信息,可以测量次序差。如幼年、少年、青年、中年、壮年、老年等。定距数据不仅可以测量差别,还可以测算距离,如10秒、20秒、30秒等。
下面介绍在设计领域常会遇到的变量类型之间的关系测量以及相对应的方法类别,具体公式与计算方法可以参看相关统计学书目。
(1)双变量统计
两个变量之间关系的探讨在用户研究中是重要的内容。相关分析是解决这个问题最为常用的统计学方法。判断两个变量之间的关系主要从它们的相关程度、相关正负、相关类型等方面来看,在通常情况下为线性相关,可从相关系数中看出两个变量之间的关系。
①两个定类变量以及定类与定序变量之间的关系可使用相关分析中的λ和τy测量法。λ测量法可以是不分变量与自变量的对称形式。如丈夫购车标准与妻子购车标准之间的关系。τy测量法要求具有自变量与因变量之别,如性别与购车标准之间的关系。定类与定序变量关系也可用此两种系数,如收入水平与购车标准之间的关系。
②两个定序变量之间的关系可以使用Gamma系数和dY系数来表示。例如同等收入水平年龄与购车价格之间的关系。
③定类与定距、定序与定距可采用相关比率测量法。如性别与某手机功能操作次数之间的关系或是年龄与后者之间的关系。除此之外,也可以使用单因素方差分析。
变量之间除相关关系还可以用函数关系来表示,线性回归分析可以测量变量之间的线性关系,它是在研究过程中将一些因素作为所控制的变量(自变量),而另一些随机变量作为它们的因变量来进行分析的。一元线性回归可以用来解决双变量统计问题。
(2)多变量统计
在设计领域中研究的问题影响因素往往较为复杂,在双变量统计不能满足要求的时候我们就要用到多变量统计方法,主要有多元线性回归分析,Logistic回归分析、聚类分析、主成分分析、因子分析等。
①多元线性回归分析。研究在线性相关条件下,两个和两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,表现这一数量关系的数学公式称为多元线性回归模型。它解决的问题是通过抽样调查的数据,确定自变量和因变量之间关系的密切程度;确定多个自变量对应变量的共同影响,比较各个自变量对因变量影响的大小;确定因变量和自变量之间的关系表达式,即回归方程式。如台灯外形表现现代感程度分别与其灯罩、灯颈、灯座造型、材质、色彩的关系,这种方法在感性工学研究中经常使用。
②Logistic回归分析。线性回归模型的一个局限性是要求因变量是定量变量(定距变量、定比变量),而不能是定性变量(定序变量、定类变量)。但是在许多实际问题中,经常出现因变量是定性变量(分类变量)的情况。Logistic回归分析就是用于处理分类因变量的统计分析方法。其因变量只取两个值,表示一种决策、一种结果的两种可能性。如消费者是否购买产品与产品性能、外观、价格、
品牌等因素之间的关系。
③聚类分析。聚类分析是研究“物以类聚”的一种多元统计分析方法。聚类分析的基本思想是根据对象间的相关程度进行类别的聚合。例如可以通过测试者对于较多产品的评价运用聚类分析将产品分别归类。又如通过对消费者生活形态的研究将其分类,有针对性地进行产品开发。聚类分析可用树艺术与设计ˉ形图来表示结果。
④主成分分析。把多个变量(指标)化为少数几个综合变量(综合指标),而这几个综合变量可以反映原来多个变量的大部分信息。为了使这些综合变量所含的信息互不重叠,应要求它们之间互不相关。例如在评价一个产品设计时,往往有很多因素,通过主成分分析可以用少数几个综合因素对其进行评价,减少工作量。
⑤因子分析。因子分析可以看成是主成分分析的一种推广。它的基本目的是,找出隐藏在一组测量到的变量中的一些更基本的,但又无法直接测量到的隐性变量(爱好、态度、能力)去解释显在变量(设计成功与否、销售量、点击率)。例如从众多人们显在的生活习惯中找到人们选择使用购买生活用品的潜在因子。这种方法可以应用在用户研究中的生活方式研究之中。
4.数据检验
数据检验其实是贯穿整个计算过程中的,一些计算方法需要检测数据是否适合做此类运算,如回归分析的拟合优度检验,因子分析的KMO检验,而回归分析可以用逆运算进行检验等。当然一般人都会认为数据是客观而准确的,但是准确的数据之后,依赖分析师的常识、经验和主观判断,来选择和运用适合分析方法,并以严谨的研究态度来完成整个分析步骤。
摘要: 目的 探讨脂肪细胞因子瘦素、肿瘤坏死因子α在代谢综合征发病机制中的作用。方法 检测社区人群瘦素和肿瘤坏死因子α的血浆水平,采用Logistic回归分析,经过对年龄和性别的调整,研究瘦素、肿瘤坏死因子α与代谢综合征的关系。结果 瘦素水平愈高发生代谢综合征的危险性愈大,瘦素与代谢综合征的关系受性别与年龄的影响,男性比女性对瘦素水平变化更为敏感,随年龄增长瘦素对代谢综合征发生的危险增大。肿瘤坏死因子α水平愈低发生代谢综合征的危险性愈大,其高水平的患病危险性是低水平的0538倍。结论 高瘦素性肥胖对代谢综合征的影响男性表现得更为明显,瘦素水平可以作为预测代谢综合征的指标,尤其在老年男性中更为有效。
关键词: 瘦素;肿瘤坏死因子α;胰岛素抵抗;代谢综合征
Effects of leptin and TNFα on metabolic syndrome
Abstract: Objective To discover the effects of the leptin and TNFα (tumor necrosis factoralpha) in the cause of metabolic syndrome.Methods The research includes testing on the level of leptin and TNFα in the blood of residents of a local community,analyzing the cause of metabolic syndrome in relation to leptin and TNFα through Logistic regression analysis by adjusting age and gender.Results The higher the leptin levels were,the higher risk metabolic syndrome was.The relationship between leptin levels and metabolic syndrome was affected by age and gender.Males were more sensitive to leptin than females.The effect of leptin on metabolic syndrome increased with the age.The lower the level of TNFα was,the higher risk metabolic syndrome was.The chances for residents with higher level of TNFα to suffer from disease was 0538 times of thos with lower level.Conclusion Obesity with high level leptin affects metabolic syndrome,especially males obsity.Leptin level can be used as an indicator in predicting metabolic syndrome.This method is especially effective to old male patients.It is necessary to do further research on thd biological mechanism of metabolic syndrome.
Key words: leptin;tumor necrosis factoralpha;insulin resistance;metabolic syndrome
代谢综合征(metabolic syndrome,MS)是心血管疾病和糖尿病发病的主要危险因素,这些疾病正日益威胁着人类生命健康,不同地区代谢综合征的患病情况及影响因素存在很大差异。有研究表明,我国60岁~人群代谢综合征患病率达20%〔1〕。目前代谢综合征的发病机制尚不完全清楚,脂肪分泌多种脂肪激素可能参与其中。本研究旨在探讨脂肪细胞因子瘦素(leptin)及肿瘤坏死因子α(tumor necrosis factoralpha,TNFα)在代谢综合征发病机制中的作用,为代谢综合征的防治提供科学依据。
1 对象与方法
11 对象 采用整群抽样方法,于2001年8月对哈尔滨市道里区通江社区和香坊区红旗社区20~74岁常住居民(在本地区居住2年及2年以上),按所在社区实际年龄别构成比例进行分层,随机选取455人。其中,代谢综合征患者162人(男62人,女100人);非代谢综合征者293人(男130人,女163人)。
12 方法 采用自行设计的调查表,记录被调查者的基本情况,包括性别、职业、文化程度、疾病既往史、家族史、吸烟与饮酒情况等,同时进行身高、体重、腰围、臀围、血压和脉搏的测量。
13 血清学检测 在受检者8h内未进食的情况下,采用拜安易血糖仪(德国拜耳公司)测量空腹血糖,同时常规静脉采血5ml,4500r/min离心5min,取血清分装后,冻存于-20℃冰箱中,待测定血清学指标。胰岛素、瘦素、肿瘤坏死因子α均采用放射免疫分析法进行检测,试剂盒(中国原子能科学研究所)。按百分位数将连续变量转换为分类变量,定义瘦素水平(ng/ml)
14 判定标准
141 代谢综合征的诊断标准 依据国际糖尿病联盟(International Diabetes Federation,IDF)判定代谢综合征的标准〔2〕,确认代谢综合征必须具备以下条件:(1) 中心性肥胖:男性腰围≥90cm,女性腰围≥80cm;(2) 另加下列4因素中任意2项:① 甘油三酯(triglyceride,TG)>17mmol/L,或已接受针对此脂质异常的特殊治疗;②高密度脂蛋白胆固醇(high density lipoprotein cholesterol,HDLC)男性
142 胰岛素抵抗的判定 采用稳态模型评估指数(HOMAIR)作为评价胰岛素抵抗的指标。HOMAIR=空腹血浆胰岛素(FINS,mu/L)×空腹血糖(FPG,mmol/L)/225〔3〕,按百分位数将其由连续变量转换为分类变量,定义HOMAIR水平
15 统计分析 采用SASS91软件进行分析,运用Logistic回归分析,探讨瘦素、肿瘤坏死因子α、HOMAIR等与代谢综合征的关系。
2 结果
21 2组各项指标比较(表1) 瘦素、肿瘤坏死因子α、空腹血糖、空腹胰岛素与HOMAIR 2组间差异均有统计学意义(P
表1 2组各项指标的比较(略)
注:2组间比较,*P
22 不同性别、年龄瘦素水平比较 代谢综合征组男性瘦素水平为(391±396)ng/ml,女性为(751±751)ng/ml;非代谢综合征组男性瘦素水平为(269±251)ng/ml,女性为(650±150)ng/ml。男性代谢综合征组的瘦素水平高于非代谢综合征组,差异有统计学意义(P
23 各项指标与代谢综合征的关系
231 单因素分析结果(表2) 在考虑年龄与性别作用的基础上,首先对瘦素、肿瘤坏死因子α、HOMAIR与代谢综合征的关系进行单因素分析,HOMAIR中水平与高水平的患病危险性分别是低水平的5179倍和9010倍,肿瘤坏死因子α高水平的患病危险性是低水平的0538倍,瘦素高水平的患病危险性是低水平的2859倍。
表2 瘦素、肿瘤坏死因子α、HOMAIR与代谢综合征关系的单因素分析结果(略)
232 多因素分析结果(表3) 在单因素分析结果差异有统计学意义(P
表3 瘦素、肿瘤坏死因子α、HOMAIR与代谢综合征关系的多因素分析结果(略)
3 讨论
研究表明,HOMAIR水平愈高发生代谢综合征的危险性愈大,Logistic单因素分析结果表明,中水平与高水平的患病危险性分别是低水平的5179倍和9010倍,说明出现胰岛素抵抗容易发生代谢综合征,证实在国际糖尿病联盟的诊断标准中,胰岛素抵抗仍为代谢综合征发生的重要环节。本研究结果显示,高年龄组(60岁~)和男性的代谢综合征组瘦素水平高于非代谢综合征组,瘦素与代谢综合征的关系受性别与年龄的影响。瘦素水平愈高发生代谢综合征的危险性愈大,男性比女性对瘦素水平的变化更为敏感,随年龄增长瘦素对代谢综合征发生的危险性增大。提示高瘦素性肥胖对代谢综合征的影响,男性表现得更为明显。因此,瘦素水平可以作为预测代谢综合征的指标,尤其在老年男性中更为有效。研究结果显示,代谢综合征组和非代谢综合征组组间肿瘤坏死因子α分布的差异具有统计学意义(P=00076),代谢综合征组肿瘤坏死因子α水平偏低者的比例高于非代谢综合征组,随着肿瘤坏死因子α水平的升高,发生代谢综合征的危险性减小,高水平的患病危险性是低水平的0538倍。这可能是由于国际糖尿病联盟的诊断标准将正常空腹血糖切点下调至56mmol/L,从而使代谢综合征患者血糖水平随之下移,而血糖是影响血清肿瘤坏死因子α水平的重要因素〔4〕。另外,代谢综合征患者存在着瘦素抵抗,降低了促进单核细胞分泌肿瘤坏死因子α的作用。所以肿瘤坏死因子α对代谢综合征的影响机制需要进一步证实。
参考文献
〔1〕 项坤三.代谢综合征的流行病学和病因学[J].国外医学:内分泌学分册,2002,22(5):280-281.
〔2〕 宋秀霞.IDF代谢综合征全球共识定义[J].中华糖尿病杂志,2005,13(3):178-180.
〔3〕 Mathews DR,Hoker JP,Rudenski AS,et al.Homeostasis model assessment:insulin resistance and βcell function from fasting glucose and insulin concentrations in mar[J].Diabetologia,1985,28:412.
Abstract Statistical inference plays a central location in the current scientific research. The course of probability theory and mathematical statistics is a introductory course of statistical inference, it is especially important to correctly grasp the nature of basic concepts of probability theory and mathematical statistics for those students who will engage in research works in the future. Based on the current syllabus of probability theory and mathematical statistics, this paper explores some of concepts which are easy to overlook their nature by students while they are studying, combined with practical examples to further understand the nature of the concepts.
Keywords Independence; conditional probability; correlation coefficient; digital features; maximum likelihood estimation
2002年美国国家基金委组织了有关“当前和显露出来的概率论学科中研究机遇”的系列报告,指出概率论与数理统计在当前已是一门核心数学学科,其概率推理理论在目前不同学科中解决其研究问题有着显著功效,其理论研究的重要性也呈现爆炸性的增长。[1]然而,鉴于目前相当一部分科研论文中使用的统计方法存在概念性的错误,[2]国际著名的学术期刊《科学》在2014年表示将增加一个特别的统计学专家团队来检验投稿论文中的统计方法是否有误。[3]其他重要的学术刊物,包括《自然》也相继提出了一些检查方案来保证论文中统计方法的使用得当。[4]统计推理应用的广泛性同基本概念错误理解之间的尖锐矛盾提示研究者在学习统计推理理论时不能停留在概念的表象,需要深入理解其本质内涵。2015年研究生入学考试的数学(一)科目中统计推理部分的试题就能很好的考察学生是否真正掌握了统计推理基本概念的本质。2015年研究生入学考试的数一试卷中概率论与数理统计部分内容一共是34分,内容覆盖了随机事件性质,概率分布,数值特征计算,假设检验等内容。从题目的难易程度来讲,在掌握基本概念内涵的前提下,基本上不存特别难的题目。但在笔者小范围的调查表明,越是考察基本概念的题越是失分严重,反而有固化解题步骤的题目得分就较多。针对目前统计推理的重要性和基本概念理解不够透彻的普遍问题,再一次为我们从事概率论与数理统计的教学工作者提出了一个在教学中一直强调的问题,如何让学生在学习过程中抓住基本概念的内在实质。结合概率论与数理统计的教学大纲,以及近几年的教学过程中学生的反馈和自己的思考,针对大学本科工科概率论与数理统计部分教学中的一些基本概念内涵教学做一个初步探讨。
1 随机事件之间相互独立的本质是随机事件概率的独立性
随机事件之间存在多种关系,其中互斥(互不相容)和相互独立在概率论的学习中使用最多,学生也最容易混淆。当内容延伸到随机变量时,随机变量的相互独立和随机变量间的相关性又会带来混淆。在讲授这些定义时,若强调其本质并加以对比就能使学生比较容易区分随机事件之间的不同关系描述的差异。首先是定义的范围不同,互斥关系定义在样本空间中,反映事件的集合性质;而相互独立和相关性是定义在事件概率的数值关系中,反映事件间的概率属性。其次相互独立表述是事件概率的一般数值关系,而相关性表述的是事件的线性关系。通过强调随机事件相互独立的本质是随机事件概率的独立性,就能辨别随机事件互斥同随机事件独立之间的关系:两事件互斥推导不出它们相互独立,同时两事件相互独立也推导不出它们互斥。通过强调随机事件相互独立反映随机事件概率间的一般数值关系,就能辨别随机事件相互独立同相关性之间的区别:随机变量相互独立可以推?С鏊?们之间不相关,但是反之不行。[5]
2 条件概率同普通概率定义本质的统一性
条件概率定义为:设A,B为两个事件,且P(A)>0,则有事件A发生的条件下事件B发生的概率为P(B|A)=P(AB)|P(A)。该定义明确直观,易于使用,在实际使用时一般都是基于单个事件概率已知前提下求条件概率,但是通过挖掘其本质,并同普通事件的概率建立关联,那么在使用的时候不会再将条件概率同一般事件概率割裂,而会形成一个统一概念。对于任意随机事件C,记其概率为P(C),当同条件概率的定义建立联系时,我们引入样本空间S,则有P(C)=P(C|S)=P(CS)/P(S)=P(CS)。通过这种变化形式可有效的解决特定事件概率不易求解的问题;同样,这也是全概公式的实质所在。
实例1:设2人抓阄,一共5个阄,其中2个阄中写有“是”字,三个空白。问抓阄是否同次序有关。
解析:分析可知所求为依次抓阄时抓到“是”的概率是否相同。
设A1,A2分别为第1,2个人抓到“是”字的事件。则有
P(A1)=2/5
故抓阄同次序无关。该方法可以延伸到更多人数抓阄的问题。
3 二维正态随机变量同一维正态随机变量之间的纽带关系――相关系数
正态随机变量有许多优良的统计性质,也是概率论与数理统计课程中重点的分布。学生一般对于一维的正态分布有较深刻的认识,但是一旦扩展到了二维及二维以上的正态分布时就不容易掌握。而二维正态分布同一维正态分布之间有很强的相关性;比如(X,Y) 符合二维正态分布,则其关X于和关于Y的边缘分布就是一维正态分布。二维正态分布的求解在一些特定场合可以转化为一维正态分布的求解,其纽带关系就是相关系数。二维正态分布中,X,Y相互独立的充分必要条件是X,Y相关系数为零。当二维正态随机变量中相关系数为零,则二维正态随机便分解成两个独立的一维正态分布随机变量的乘积。
实例2:设二维随机变量(X,Y)服从正态分N(1,0;1,1,0)布,则P(XYY
解析:因为(X,Y)~N(1,0;1,1,0),其中X,Y,相关系数为0
故有X~N(1,1),Y~N(0,1),且X,Y相互独立
进而有X1~N(0,1),且与Y相互独立
故由标准正态分布的性质可得到结果
P(XYY
4 随机变量的数字特征是常量
随机变量的分布一旦确定,其数值特征是常量;在实际的使用中,一般不会明确随机变量的分布形式,只是指称随机变量符合某种分布,在这个前提下,随机变量的数值特征一般用一个符号表示。如果不知晓随机变量的数值特征是一个常量,在解题的过程就会发生把数值特征当作变量使用。在教学的过程中一定要多次强调此概念。尤其在讲授方差计算公式的时候,可以通过对其的证明来强调随机变量的数值特征是常量这一概念。[5]
在此强调E(X)是一常量,并且也附加强调D(X)也是一常量,类似于数字特征性质中常数符号a,进而就可以利用已学习过的数学期望的性质得证。
5 最大似然估计方法其本质是使得似然函数取最大值时未知参数的取值就为该未知参数的最大似然估计值
在常规最大似然估计方法的教学中,一般会总结该方法为一个标准的流程,学生在学习的时候也会以记忆该流程作为最终的目的,当解题的条件稍微偏离常规的流程,?W生就不知所措,不知道该如何处理;如果我们在教学的过程中首先让学生明确最大似然原理的本质意义,就会依据最大似然原理来对常规流程做一变通。2015年考研的最后一个题就很好的体现这种思维。
实例4:设总体X的概率密度为:
其中 为未知参数,X1,X2,……,Xn为,来自该总体的简单随机样本。求 的最大似然估计量(2015年研究入学考试题23.II)。
解析:该题目的求解目的非常清楚,按照解题流程按步推进。
到了这一步发现对似然函数对数求导并不能使之为0,有些同学就卡到了这儿。如果学生知道这步对似然函数对数求导的目的是什么,就可轻易获得 的估计量。第二步的目的通过求解似然函数获得最大值时未知参数 的取值,也就是该未知参数 的估计量。既然不能为零,那么我们就探讨下这个求导后所得函数的特点,发现该导数函数是关于 单调增加;而由题目中的定义知 的取值范围为: ≤x≤1,那么我们就能获取 的估计量为:=min{x1,x2,…,xn}。
股权激励制度通过让企业管理层以一定方式获取公司的一部分股权,将管理层的利益、股东利益、企业长远发展联系在一起,能够激励管理层努力工作,从而降低委托成本,提升企业业绩。但在实际中,股权激励制度是否能起到预期的作用,很多学者作了大量的实证研究,但并未得到一致结果。本文在借鉴前人研究成果的基础上,选取我国沪深两市2006年至2011年已经实施股权激励的101家上市公司为对象,对股权激励效果进行了实证研究,以期对该制度的顺利实施和达到预期目的有所裨益。
二、研究设计
(一)研究假设 股权激励制度通过让管理层持有一定比例的公司股份,使其成为公司股东,有效地约束和激励管理层,降低公司的委托成本。管理层持股比例越大,就越有动力积极努力工作,委托成本就越低。根据以上分析,本文提出假设:
假设1:我国上市公司股权激励比例与委托成本呈负相关关系
设计股权激励制度时,股权激励比例的确定至关重要。根据“利益趋同”假说,当对管理层的股权激励比例增大时,管理层与所有者的利益会更加趋向一致,管理层就会有更大的动力努力工作实现股东财富最大化,因此企业的业绩就会提高。据此提出假设:
假设2:我国上市公司股权激励比例与企业业绩呈正相关关系
“壕沟防御”假说则认为当管理层股权激励比例超过一定水平时,管理层就会对企业拥有更多的控制权,管理层为了实现自身利益的最大化,可能会采取一些不正当的方法侵害股东利益。基于此,根据我国的实际情况,很多学者更倾向于股权激励比例与公司业绩之间存在曲线关系而非直线关系,要想股权激励制度发挥出应有的作用,就要合理设计股权激励比例。基于以上分析,本文提出假设:
假设3:我国上市公司股权激励比例与企业业绩之间存在曲线关系
股权激励的有效期是指从授予时间算起到可以行使权利的期间。如果股权激励有效期太短,意味着管理层要在短期之内达到行权所规定的条件,这样就会造成管理层追求短期绩效,从而对公司的长远发展带来负面影响。在这种情况下,股东对管理层的监督成本会增加,委托成本会上升,同时,管理层如果只顾短期内为自身谋取利益,就会对公司的业绩产生不良影响。据此假设:
假设4:我国上市公司股权激励有效期长短与企业业绩呈正相关关系,与委托成本呈负相关关系
(二)样本选取和数据来源 本文主要研究的是我国上市公司股权激励的实施效果。在样本选取上,跟国内以前同类研究略有所不同。本文选取2006-2011年己经实施了股权激励的沪深两市上市公司。相比处在预案阶段的公司,用已经实施股权激励的公司作为样本,得到研究结果更为可信。此外,本文还剔除了缺少数据的公司以及ST公司,这样共得到101家上市公司作为研究样本。研究所用的截面数据为2011年12月31日各上市公司公布的年报数据。本文研究所用的数据主要来源于深圳证券交易所、上海证券交易所官方网站以及中国股权激励年度报告,并运用SPSS20.0进行数据分析。
(三)模型建立和变量定义 根据本文提出的四条研究假设,建立如下回归模型:
AC=α+β1MSR+β2SIZE+β3DEBT+β4LASP+β5GROWTH+ε (模型1)
ROE=α+β1MSR+β2SIZE+β3DEBT+β4LASP+β5GROWTH+ε(模型2)
ROE=α+β1MSR+β2MSR2 +β3SIZE+β4DEBT+β5LASP+β6GROWTH+ε (模型3)
ROE=α+β1JLT+β2SIZE+β3DEBT+β4LASP+β5GROWTH+ε(模型4)
AC=α+β1JLT+β2SIZE+β3DEBT+β4LASP+β5GROWTH+ε(模型5)
其中,α为常数项,ε是误差项,β1-β6分别是各变量的系数。模型中各变量定义如下:(1)被解释变量。委托成本(AC)。本文主要采用管理费用率来作为反映委托成本的指标。计算公式为管理费用除以主营业务收入。管理费用率与成本成正比。管理费用率越高,成本就越大;管理费用率越低,成本就越小。企业业绩(ROE)。本文采用扣除非经常性损益后的加权平均净资产收益率来表示企业业绩,以下简称净资产收益率,即净利润/股东权益平均总额。净资产收益率与企业的业绩成正比,净资产收益率越高,表明企业的业绩越好,公司的盈利能力和股东所得回报也就越大。(2)解释变量。股权激励比例(MSR)。股权激励比例指股权激励的份额占总股本的比例。股权激励的有效期(JLT)。股权激励有效期指给予激励对象可以行使股权所赋予的权利的时间段。(3)控制变量。公司规模(SIZE),表示企业资产规模,为当年总资产的自然对数;资产负债率(DEBT),表示企业的负债风险,为企业当年的负债总额/资产总额;股权集中度(LASP),指第一大股东持股比例;成长能力(GROWTH),选用总资产增长率,作为反映公司成长性的指标,为(年末总资产数-年初总资产数)/年初总资产数。相关变量定义见表(1)。
三、实证检验分析
(一)描述性统计 本文应用SPSS20.0,对101家样本公司描述性统计分析结果如表(2)所示。可以看出,股权激励比例,最小为0.24%,最大为9.96%,均值为4.09%,标准差为2.59,表明各样本公司之间激励水平还是有较大差距的。股权激励有效期的平均值为4.98,说明我国上市公司的股权激励年限较短。从上述统计表中还可以看出ROE的最小值为-0.2373,最大值为0.67,均值为0.1228,标准差较小,为0.1162,说明样本公司净资产收益率之间的差异并不是很大。成本最小值为0.0169,最大值为0.3886,标准差为0.0798,标准差较小,说明样本公司管理费用率之间的差异也不是很大。控制变量中,公司规模、财务杠杆,总资产增长率的差异较为明显,说明各公司的规模大小和对负债的利用程度是不同的。上述描述性统计可以使我们对样本的特征有一个整体印象,为后续的实证研究打下基础。
(二)相关性分析 进行回归分析之前,为了检查自变量之间是否存在严重的多重共线性,就必须对自变量进行相关性检验,以减少偏差,确保研究结果的准确性。一般来说,如果变量之间相关系数r 的绝对值不超过0.8,说明变量之间不存在严重的多重共线性。对各自变量进行相关性检验得到如下结果,见表(3)。可以看出,各自变量的相关系数r的绝对值都小于0.8,因此可以证明本文所选取的各自变量之间不存在严重的多重共线性,回归模型是有具有统计学意义的。
(三)回归分析 运用回归模型进行回归分析如下:(1)运用所建模型1对管理层股权激励比例与委托成本之间的关系进行多元回归分析,结果见表(4)。可以得出模型1的回归结果中R2为33.4%,这表明成本有33.4%能被股权激励比例解释。F值为9.543,在1%的水平上显著,通过了方程显著性检验,说明模型1具有统计学意义。成本与股权激励比例的系数为负值,并且P值为0.027小于0.05,通过了5%的显著性的检验,因而接受假设1,即股权激励比例与委托成本负相关,成本会随着股权激励比例的升高而降低。(2)运用所建模型2对管理层股权激励比例与企业业绩之间的关系进行多元回归分析,结果见表(5)。可以得出模型2的回归结果中R2为9%,这表明净资产收益率有9%能被股权激励水平解释。F值为1.879,在10%的水平上显著,通过了方程显著性检验,说明模型2具有统计学意义。净资产收益率与股权激励比例的系数为正,但是P值为0.103大于0.1,因此不能通过显著性检验,由此得出二者不具有显著的正相关性,拒绝假设2。但是对于提高公司业绩,股权激励还是有一定作用的。(3)运用所建模型3对管理层股权激励比例的平方与企业业绩之间的关系进行多元回归分析,结果见表(6)可以得出模型3的回归结果中R2为9%,F值为1.551,在10%的水平上显著,通过了方程显著性检验,说明模型3具有统计学意义。同时还可以看出,ROE和MSR的相关系数为正,并且在10%的水平下显著,ROE和MSR2 的相关系数为负,并且在5%的水平下显著, 由此证明假设3,并拒绝假设2。从中还可以得出如下公式:ROE=-0.137+0.096MSR-0.517MSR2+0.010SIZE-0.022DEBT-0.056
LASP +0.137GROWHT。对公式进行分析得出:MSR的系数为正值,表明一定持股比例水平下,随着股权激励比例的增大,管理层与股东利益趋向一致,高管人员会更加努力地工作,为公司创造更多价值。MSR2的系数为负,表明当管理层持股上升到某一特定比例时,管理层会利用手中权力谋取私利,对企业业绩提升产生负面影响。对上式求导可得出,当股权激励比例为9.28%时,净资产收益率最大,实现了企业业绩最大化。根据前文的描述性统计结果,样本公司股权激励比例的平均水平为4.0939%,远远低于9.28%。因此,为了实现公司业绩最大化以及有效使用人力资本,我国上市公司要适度提高股权激励比例,使其达到一个最佳水平。(4)本文运用所建模型4对股权激励有效期与企业业绩之间的关系进行多元回归分析,由表(7)可以得出模型4的回归结果中R2为8.4%,这表明净资产收益率有8.4%能被股权激励有效期解释。表(8)中F值为1.731,p值为0.135大于0.1,未通过方程显著性检验,表明模型4不具有统计学意义。因此直接拒绝假设4,即激励有效期长短与公司绩效不相关。(5)运用所建模型5对股权激励有效期与委托成本之间的关系进行多元回归分析,结果见表(9)。可以得出模型5的回归结果中R2为32.3%,这表明管理费用率有32.3%能被股权激励有效期解释。F值为9.065,在1%的水平上显著,通过了方程显著性检验,说明模型5具有统计学意义。管理费用率与股权激励有效期的系数为负值,并且P值为0.026小于0.05,通过了5%的显著性检验,因此接受假设5:激励的有效期长短与成本负相关,激励有效期越长,成本越小。
四、结论与建议