HI,欢迎来到学术之家,期刊咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0
首页 精品范文 统计学决策规则

统计学决策规则

时间:2023-07-28 17:31:20

开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇统计学决策规则,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。

统计学决策规则

第1篇

关键词:信用风险;模糊聚类;变精度粗糙集;决策规则

中图分类号:F830.5 文献标识码:A 文章编号:1003-5192(2009)05-0032-06

Credit Risk Evaluation Based on Fuzzy Cluster and Variable Precision Rough Set

GUO Jun-hua1,2,LI Bang-yi1

(1.School of Economics and Management, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China; 2.School of Economics and Management, East China Jiaotong University, Nanchang 330013, China)

Abstract:Credit risk evaluation is one of the most important problems in the finance field. Fuzzy cluster and variable precision rough set theory are introduced to evaluate credit risk. Fuzzy cluster is applied to discriminate sample data. Then, decision rules are extracted by variable precision rough set theory. The result indicates that sample datacan be classifiedcorrectly by the decision rules which have the character of anti-interference.

Key words:credit risk; fuzzy cluster; variable precision rough set; decision rule

1 引言

信用风险评价是商业银行贷款的重要依据。世界银行对全球银行业危机的研究表明,导致银行破产的主要原因就是信用风险[1]。随着2007年我国银行业的全面放开,我国商业银行面临的竞争更加剧烈,如何科学、合理地对企业做出正确的信用风险评价,是一个值得研究的问题。传统的信用评价方法存在某些不足,必须引入新的理论,对信用评价方法加以改进。粗糙集理论作为研究不确定知识表达、学习、归纳的新型数学工具,其重要特点是不需要预先给定某些特征或属性的数量描述,而直接从给定问题的描述集合出发,在信息不确定情况下,仍可挖掘出大量对决策有帮助的知识信息[2]。粗糙集理论提供了一整套比较成熟的样本学习式决策方法。由于标准粗糙集理论在某些条件下具有一定的局限性,缺乏对复杂系统的处理机制,对于不确定性概念的边界区域,刻画过于简单,缺乏对噪音数据的适应能力。而在实际应用中,噪音是难免的,因此Ziarko提出了变精度粗糙集(Variable Precision Rough Set,简称VPRS)模型[3],增强粗糙集合模型的抗干扰能力。本文利用变精度粗糙集理论,根据2007年我国部分上市公司公布的年报数据,以部分财务指标作为基本属性,从中筛选出能反映评价指标本质关系的重要属性,从而挖掘出数据间的关系而形成信用评价决策规则。通过这些由训练数据抽取的决策规则对测试数据进行判别表明,该方法具有良好的分类判别能力。

2 文献回顾

在信用风险评价的文献中,主要存在三类不同的方法。第一类是统计分类方法,第二类是神经网络方法,另一类是支持向量机方法。

2.1 统计分类方法

早在1966年,Beaver[4]首次运用单变量判定分析法来研究公司财务危机问题,但该方法因财务比例的选取不同而观测结果相差很大,所以很快被多变量分析法所取代。1968年,Altman率先将判别分析法应用于财务危机、公司破产及违约风险的分析,建立了Z-Score模型[5],该模型只适用于短期的预测。Altman在1977年及1983年又在Z-Score模型基础上进行了改进,建立了ZETA模型[6,7],研究结果表明ZETA模型优于Z-Score模型。Martin、Ohlson、Maddala[8~10]等人分别在1980年前后将Logistic模型应用于信用风险分析,并认为Logistic模型优于Z-Score模型和ZETA模型。

国内学者在统计分类方法应用于信用风险评价的研究上也做出了具大贡献。陈静[11] 、张玲[12]分别利用线性判别分析法对企业信用风险进行了研究。唐晓岸、孟庆福[13]、姜天、韩立岩[14]、陈晓虹、戴静[15]、宋荣威[16]等人分别运用Logit模型对企业进行了财务预警分析。研究表明,线性判别分析法和Logit模型对企业信用风险评价有一定的准确性。

2.2 神经网络方法

从20世纪90年代开始,国内外学者将神经网络方法应用于信用风险的评价,方法大致有多层感知器(MLP)、BP算法网络、径向基函数(RBF)网络、概率神经网络(PNN)等几种,其中用得最多的是BP算法网络。Altman、Marco和Varetto运用MLP神经网络技术对意大利公司进行财务危机预测[17]。West分别建立MLP网络结构和RBF网络对德国和澳大利亚的银行贷款企业的财务数据进行两类模式分类[18]。Jensen、Tam、Coats等人[19~21]则分别应用BP算法针对财务状况进行了评价。Yang和Marjorie利用PNN技术建立公司破产预警模型,对美国122家石油公司进行财务困境预警研究[22]。

在国内,学者庞素琳[23~25]对神经网络的几种模型分别进行了研究。陈雄化、林成德、叶武[26]、胜、梁[27]等研究了BP算法在信用评价中的应用。从国内已有文献来看,国内研究对BP算法及其改进模型在信用评价中的应用较多。

2.3 支持向量机方法

支持向量机(SVM)方法是1995年Vapnik根据统计学习理论提出的一种学习方法,研究如何根据有限学习样本进行模式识别和回归预测等,使在对未知样本的估计过程中,期望风险达到最小[28]。该方法提出后,国内外很多学者把SVM模型应用到信用评价分析。Fan和Palaniswami利用SVM对企业破产进行预测[29]。姚奕和叶中行[30]利用SVM研究银行客户信用评估系统。钟波等[31]建立了基于LS-SVM的信用评价模型。肖文兵、费奇、万虎[32]也对支持向量机的信用评价模型进行了分析。

以上各种方法各有其优缺点。线性判别分析法最大的优点是解释性强,且简单明了,但其假定条件过于严格,如要求每组数据满足:(1)服从多元正态分布。(2)协方差矩阵相同。(3)均值向量、协方差矩阵、先验概率和误判代价已知。而现实中这几个条件难以满足。Logit模型的优点是不需要假定任何概率分布,也不要求等协方差性,但当样本点完全分离时,模型参数的最大似然估计可能不存在而导致该方法完全失效。人工神经网络是一种对数据分布无任何要求的非线性技术,它能有效解决非正态分布、非线性的信用评估问题,但其结构确定困难,且解释性差。支持向量机方法的最大优点是能有效解决小样本问题,并且无须样本数据满足正态性和齐次方差的条件,但其分类准确率和预测准确率依赖于核函数的选取,其参数的选取都是通过反复的试验,人工选择出令人满意的参数,这种方法需要人的经验做指导,并且它的选取需要付出较高的时间代价,这样限制了支持向量机的发展。目前这三种方法中哪种方法的综合效果较优还存在一些争论,考虑到粗糙集理论在数据推理方面的强大功能,本文尝试引入变精度粗糙集理论构造信用评价模型,并对我国2007年部分上市公司进行分类。

3 数据选取和模型介绍

3.1 指标体系说明

企业信用风险的形成主要取决于企业财务状况,因此,企业信用评级通常将对企业信用风险的测度转化为对企业财务状况的衡量。而影响公司财务变化的主要因素包括公司的盈利能力、营运能力、偿债能力、成长能力等指标。结合已有相关文献[2~31],本文拟采取如下指标体系,见表1。

3.2 样本数据选择

考虑到不同行业的生产经营特点不一样,在信用评价时如果采用相同的评价方法难免有失公允,在数据选取时应尽量选取具有相同特点的行业板块。本文在沪深证券交易所2007年年报公布的按照CSRC行业分类中的所有制造业板块中随机抽取40家企业为样本,其中ST类10家,不亏损公司30家。从其中10家ST公司中随机选择5家作为训练样本,另5家作为测试样本;同理,从30家不亏损公司中随机选择15家作为训练样本,另15家作为测试样本。主要数据采自中国上市公司资讯网上市公司财务报表及《上海证券报》、《中国证券报》上刊登的上市公司相关公告。

3.3 模型说明

变精度粗糙集是对标准粗糙集理论的一种扩展,它通过设置阈值参数β,放松了标准粗糙集理论对近似边界的严格定义,允许概率分类。与标准粗糙集相比,当对象在变精度粗糙集中分类时,在它的正确分类中有一个置信度,这一方面完善了近似空间的概念,另一方面也有利于根据粗糙集理论从认为不相关的数据中发现相关信息。当对象按变精度粗糙集分类时,需定义一个正确分类的阈值β。Ziarko称β为分类误差,定义区域为0≤β

(1)模糊聚类法(Fuzzy Cluster,简称FC)离散化决策表

粗糙集理论分析要求数据必须以类别的形式出现。因此,连续数据必须首先进行离散化处理,离散的结果可能会减小原始数据的精度,但将会提高它的一般性。数据离散方法一般分为专家离散与自动离散。专家离散指由某领域的专家根据他的判断或使用该领域确定的专家进行离散;自动离散方法可分为有监督离散法和无监督离散法,其中无监督离散法可视为一个简单的聚类过程,本文使用模糊聚类分析法分别对每个指标进行离散化处理。

在实际问题中,一组事物是否属于某一类常常带有模糊性,即问题的界限不是很清晰,对该类问题,模糊聚类分析能做出“在某种程度上是”的回答,用该方法能较好地对决策表进行离散化。假定待分类的对象集合为X={X1,X2,…,Xn},集合中的每个元素具有m个特征,设Xi中的第j个特征值为xij(j=1,2,…,m),本文中对每个指标分别进行分类,故m=1。离散步骤如下:

当β=1时,aprβp(X)、aprβp(X)与标准粗糙集模型的上近似和下近似相同,则标准粗糙集模型就变成了变精度粗糙集模型的特殊情况。对于标准粗糙集意义下的不一致规则,根据设定的阈值β,若不一致性较弱,则可以认为这种不一致性是由于数据中存在少量噪声引起的,因此仍可把这部分规则或者主要部分看作一致性规则,若不一致性较强,则可认为据此不能得到任何确定性的信息,而将每个数据对象看作一条随机规则。

(3)变精度粗糙集的分类质量

变精度粗糙集的分类质量为

4 实证分析

首先使用模糊聚类分析法分别对训练样本中的每个指标进行离散化处理,每个指标分为三类,产生的决策表如表2所示,其中“1”表示该指标“好”,“2”表示该指标“中等”,“3”表示该指标“差”,可表示为123。对于决策属性本文沿用国内文献的研究习惯,采用两类模式分类,即非ST类上市公司视为“信用好”企业,用“1”表示, ST企业视为“信用差”企业,用“2”表示,表中的D为决策属性。

由表3所述的决策规则一表明,如果上市公司每股收益至少为中等,并且主营业务利润率至少中等,同时满足主营业务增长率至少中等,则该企业可视为“信用好”的企业;如果在每股收益、主营业务利润率及主营业务增长率之间有一个为差,则该企业视为“信用差”的企业。其中每股收益和主营业务利润率反映的是企业的赢利能力,主营业务增长率反映的是企业的发展能力,这三者分别表明了该企业的赢利能力及持续发展能力。表4所述的决策规则二表明,如果上市公司每股收益至少为中等,并且净资产收益率至少中等,同时满足净资产增长率至少中等,则该企业可视为“信用好”的企业;如果在每股收益、净资产收益率及净资产增长率之间有一个为差,则该企业视为“信用差”的企业。其中每股收益和净资产收益率反映的是企业的赢利能力,净资产增长率反映的是企业的发展能力,这三者同样表明了该企业的赢利能力及持续发展能力。这两条决策规则都反映了上市公司的赢利能力及上市公司的成长性,是企业信用评价的重要依据。

分别用表3及表4中的决策规则对测试样本中的20家公司进行判别表明,在抽取的两类决策规则中各有一例ST公司误判为信用好的公司,误判率为5%,分类准确率为95%(见表5),这充分说明了变精度粗糙集在信用风险评价上的可行性。

由生成的决策规则一和决策规则二对20个测试样本分析结果可知,变精度粗糙集方法能很好地识别样本企业的信用等级,证明了该方法的有效性。并且该方法具有一定的抗干扰能力,对偶然因素导致的异常数据也能较好地识别。比如某ST公司每股收益为0.13元,该指标虽然为“中等”,但由于其主营业务利润率为负并且呈下降趋势,故该公司仍然存在财务风险,从而信用风险较大,变精度粗糙集方法能够识别这种异常数据,排除干扰;另外两家ST公司虽然净资产增长率指标都为“好”,但这主要是因为这两家公司实施了资产注入或投资收益导致的,其主营并没发生很好的改观,所以其经营仍然存在较大的风险,存在一定的信用风险,则利用生成的决策规则能很好地排除这种异常数据的干扰,能够识别出这类公司的信用风险。

5 结束语

在当前的分类评价决策问题中,由事例导出规则是人工智能中的一个典型的方法。本文先利用模糊聚类方法对原始数据进行离散化处理,然后将变精度粗糙集理论应用于企业信用评价中,获得了一些有益的规则和知识。获取的规则能够对企业财务状况进行科学地分类评价,并且能有效地排除异常数据的干扰。这种规则数量较少、解释性较强,能够为企业信用评价提供一些指导性的决策建议。变精度粗糙集理论无需任何假定条件,避免了统计分类方法的弊端;由变精度粗糙集理论生成的决策规则解释性强,弥补了神经网络方法的不足;变精度粗糙集理论的应用也能排除支持向量机理论反复选取核函数的较大的时间代价。基于上述优点,变精度粗糙集理论在信用评价中必然具有广阔的应用前景。需要指出的是,由于本文所研究的决策表较小,所以能较容易地搜索到所有约简,并对其进行系统地分析,若决策表很大,则搜寻所有的约简是一个NP难问题,在实际应用中,只需选择其中的一个约简进行分析即可。由于β值与分类精度是逆相关的,随着β值的增大,分类精度减小,X的正域与负域将缩小,而边界将扩大,这意味着只有少数对象被分类;而随着β值的减小,分类精度增大,X的正域与负域将扩大,而边界将缩小,这意味着大多数对象被分类,但可能被误分;在实际运用中应该根据精度要求对β作合理的设置。

参 考 文 献:

[1]世界银行.新兴市场经济中的商业银行[M].北京:中国经济出版社,1997.

[2]Pawlak Z. Rough sets theory and its applications to data analysis[J]. Cybernetics and Systems, 1998, 29: 661-668.

[3]张文修,吴志伟,梁吉业,等.粗糙集理论与方法[M].北京:科学出版社,2001.

[4]Beaver W H. Financial Distress: a complete guide to predicting, avoiding, and dealing with bankruptcy[M]. Brain-Brum Field Inc., 1982.

[5]Altman E I. Financial ratios,discriminant analysis and the prediction of corporate bankruptcy[J]. Journal of Finance, 1968, 9(4): 589-679.

[6]Altman E I, Heldeman R G, Narayanan P. ZETA analysis: a new model to identify bankruptcy risk of corporations[J]. Journal of Banking and Finance, 1977, 1: 29-54.

[7]Altman E I. Corporte financial distress[M]. New York:John Wiley & Sons, 1983.

[8]Earky M D. Warning of bank failure: a logit regression approach[J]. Journal of Banking and Finance, 1977,1(3): 249-276.

[9]Ohlson J. Financial rations and the probabilistic predcition of bankruptcy[J]. Journal of Accounting Research, 1980, 1: 109-130.

[10]Maddala G S. Limited-dependent and qualitative variables in econometrics[M]. Cambridge: Cambridge University Press, 1983.

[11]陈静.上市公司财务恶化预测的实证分析[J].会计研究,1999,(4):31-38.

[12]张玲,张佳林.信用风险评估方法发展趋势[J].预测,2000,19(4):72-75.

[13]唐晓岸,孟庆福.上市公司信用评价模型[J].预测,2002,21(2):39-43.

[14]姜天,韩立岩.基于Logit模型的中国预亏上市公司财务困境预测[J].北京航空航天大学学报(社会科学版),2004,17(1):54-58.

[15]陈晓虹,戴静.基于Logit模型的中小企业成长危机预警[J].系统工程,2007,25(1):72-77.

[16]宋荣威.信贷风险度量的Logit模型检验[J].电子科技大学学报(社会科学版),2007,9(5):18-21.

[17]Altman E I, Marco G, Varetto F. Corporate distress diagnosis:comparisons using linear discriminant analysis and neural netwoeks(the Italian experience)[J]. Journal of Banking and Finance, 1994, 18: 505-529.

[18]West D. Neural network credit scoring models[J]. Computer & Operations Research, 2000, 27: 1131-1152.

[19]Jensen H L. Using neural networks for credit scoring[J]. Managerial Finance, 1992, 18(6): 15-26.

[20]Tam K Y, Kiang M. Predicting bank failures: a neural network approach[J]. Management Science, 1992, 38(7): 927-947.

[21]Coats P, Pant L. Recoganizing financial disstress patterns using a neural network tool[J]. Financial Management, 1993, 22(3): 142-155.

[22]Yang Z R, Marjorie B, Platt H D. Probabilistic neural networks in bankruptcy prediction[J]. Journal of Business Ressearch, 1999, 44: 67-74.

[23]庞素琳,王燕鸣.多层感知器信用评价模型研究[J].中山大学学报(自然科学版),2003,42(4):118-122.

[24]庞素琳,黎荣舟,徐建闽.BP算法在信用风险分析中的应用[J].控制理论与应用,2005,22(1):139-143.

[25]庞素琳.概率神经网络信用评价模型及预警研究[J].系统工程理论与实践,2005,(5):43-48.

[26]陈雄华,林成德,叶武.基于神经网络的企业信用等级评估[J].系统工程学报,2002,16(6):570-575.

[27]胜,梁.遗传算法优化神经网络及信用评价研究[J].中国管理科学,2004,12(1):68-74.

[28]Vapnik V N. The nature of statistical learning theory[M]. New York: Springer-Verlag, 1998.

[29]Fan A, Palaniswami M. Selecting bankruptcy predictors using a support vector machine apporach[A]. Proceedings of the International Joint Conference on Neural Network[C]. USA:IEEE Computer Society Washington,DC, 2000. 354-359.

[30]姚奕,叶中行.基于支持向量机的银行客户信用评估系统研究[J].系统仿真学报,2004,16(4):783-786.

第2篇

关键词:隐私信息;关心程度;关联分类

The users' privacy concerns about personal information arise with the emergence of the internet that also brings user's life many advantages.With a questionnaire survey, this paper investigates the personal information concerned by users and the concern level employing the statistical analysis and associative classification technology. The result indicates that Chinese internet user's concern level is still low although the concern level is much higher than ever. Moreover, the concern level for different kinds of privacy information is distinct. The concern level to specific personal information is also varied ranging from the user's age, sex and education level. The conclusions provide some useful suggestions for electronic commerce sites to effectively protect the users' personal information.

Key words:

一、引言

网络发展到今天,已经成为人们生活中不可或缺的一种工具。只需轻轻按动鼠标,人们即可随时随地购买所需产品或服务、与远在世界各地的亲朋好友交流、从事一些特殊的研究、培训或工作,还可以及时快速的了解世界各地的新闻,等等。但是,随着网络使用率的不断增高以及相关技术的不断进步,使得收集大量的用户隐私信息变得非常容易。Federal Trade Commission (FTC) 在1999年3月所作的一次研究表明:约有92.8%的网站至少收集用户的一项身份信息,56.8%的网站至少收集一项人口统计学方面的信息[1]。网站和个人的这些收集他人隐私信息的做法引起用户对自己在网上活动时所留下的个人隐私信息的关心。Harris 等人在1998年所作的调查结果显示:87%的网络用户“关心”在线时自己的隐私信息是否会受到威胁,56%的用户“非常关心”这一点[2]; Jupiter 于2002年的研究结果表明:70%的美国用户关心自己的网络隐私[3];Harris在2004的调查分析得出:65%的被调查者称自己由于关心自己的隐私而拒绝在电子商务网站上注册[4]。PC world survey于2003年调查了1500网络用户,结果表明88%的人对于网站是否分享他们的e-mail地址非常关心,91%的人关心当自己在线时会不会被网站跟踪[5];Statistics Canada 在2006年调查结果表明:57%的用户在线使用信用卡时非常谨慎[6]。与用户的隐私关注相一致,众多学者开始从理论角度对隐私问题进行探讨,得出了大量的研究成果[7-9]。

许多学者从不同的角度对隐私关心问题进行了研究。其中,大部分的研究是针对隐私关心和隐私行为之间的关系或隐私关心和信任之间的关系[9,10],这些研究仅对用户是否关心隐私进行调查,建立隐私关心和隐私行为或信任之间的关系,并未对用户具体关心的隐私信息及关心程度进行研究;Huberman等人使用实验的方式对网络用户的隐私信息进行了定量研究,得出每项隐私信息都有一定的价值,且价值因用户不同而不同[11],但是并未说明各类用户的隐私价值在哪些方面存在差异。

中国在网络隐私权方面的研究越来越多,但是在隐私关心方面却鲜有研究。笔者针对这一情况,通过调查分析,找出网络用户所具体关心的隐私信息及关心程度,为后续更深入的研究网络用户对隐私关心程度不同的原因及其他相关问题提供参考。

笔者在此基础上认为,在中国文化的影响下,中国网络用户对于各项隐私信息的总体关心程度是不同的;此外,受性别、年龄和学历的影响,中国各类用户对于各项个人隐私信息的关心程度存在一定的差异。因此,笔者提出两个假设:(1)中国网络用户对每项隐私信息的关心程度是不同的;(2)不同性别、年龄、学历的用户对各类隐私信息的关心程度存在一定的差异。笔者采用问卷调查的方式,利用统计分析和关联分类的方法,对这两点假设进行研究。

二、研究方法

(一)问卷设计

笔者在参阅相关资料的基础上,重点研究网络用户的26项隐私信息,并将其分为人口统计学信息、财务信息、偏好信息、家庭信息、社会信息等五类信息(见表1),这5类信息的划分并没有明显的界限,有些信息可以同属两类信息,这对结果并没有明显的影响。

笔者采用问卷调查的方式进行研究。问卷共九个问题,每个问题都有被选项(单选和多选均有)。问卷。首先选择30人做预调查,对预调查的结果请相关领域的专家分析后进行了相应的修改。然后进行大范围的调查,被调查者为在校大学生、研究生、工程师、医生、教师、公务员等各个行业一共350人,其中在校大学生及研究生占整个被调查者的三分之一,收回问卷332份,回收率为94.86%,其中有效问卷为324份,针对这324份问卷做了分析。问卷的alpha系数为0.985。

参照中国互联网络信息中心(CNNIC)对网民年龄的划分标准,考虑到不同年龄段的用户的生活背景,对网络的认识、接触网络的机会以及用途均不同,因此,为了了解各类用户对各类隐私信息的关心程度的差异性,对被调查者的年龄和学历进行划分,划分结果如表2所示。

(二)数据处理方法

1.统计方法

为了验证引言中所述的第一个假设,即网络用户对各项隐私信息的关心程度是不同的(网络用户对各项隐私信息关心程度的差异性),对调查结果进行了分析。由于个人信息项非常多,如果采用划分等级的方法(即请被调查者针对自己的每项信息都给一个关心等级,如“非常关心”“关心”“比较关心”、“不关心”),可能会使被调查者很难选择或者全都选 “非常关心”,因此请被调查者在所列出的26项个人信息当中选出不超过15项自己关心的信息,然后再对每项信息进行频数统计,得出用户对每项信息的关心程度(见表3)。

2.关联分类方法

为了验证第二个假设,得出不同用户对各项隐私程度关心程度的差异性,笔者采用关联分类的方式对数据进行了处理。

关联分类(associative classification, AC)是一类新的面向决策表的规则获取技术,其核心思想是利用关联规则挖掘技术,通过频繁项集挖掘、决策规则生成以及规则剪枝等过程获取条件属性与决策属性的关联关系,即决策规则 (称为分类关联规则(classification association rule) ),并利用生成的分类关联规则构建决策系统。研究表明,AC方法能够发现传统方法挖掘不到的规则[12-15]。因此,笔者以关联分类为工具,对用户的隐私信息进行分析,以便找出用户特征与其对隐私关心的联系,并且根据这种联系的强弱,得出用户对不同隐私信息的关心程度。在掌握网络用户对不同隐私信息的关心程度之后,商务网站可以有针对性的重点保护网络用户比较关心的个人隐私信息,提高用户对网站的信任水平,为企业创造更多的商机。

三、结果

(一)网络用户对隐私信息的关心程度

根据表3结果,将关心程度分为四个等级(非常关心、关心、比较关心和不关心),关心程度值大于0.7的为“非常关心”,关心程度值大于0.5的为“关心”(其中“家庭信贷情况”这项信息的关心程度值为0.494,非常接近0.5,所以将其划分到“关心”这个等级),关心程度值大于0.2的为“比较关心”,小于0.2的为“不关心”,根据每项隐私信息的关心程度值将其放入相应位置,建立了个人隐私信息的关心程度矩阵(表4)。 

虽然近几年中国网络用户的隐私观念有所改变,但从表3可以知道,中国网络用户对个人隐私信息的关心程度依然不高,仅对银行卡号和身份证号这两隐私信息的关心程度超过了0.6。这主要是受中国传统文化的影响[16]。

为了更进一步的解释假设一,下面笔者对每类隐私信息的关心程度进行简要分析。

1.人口统计学信息

从表3中可以看出,网络用户最关心身份证号这项信息,其次是姓名和年龄,而对性别、身高、体重等信息则不关心。

在我国,身份证号是确定一个人身份的重要证件,如果此项信息泄露,可能会对个人造成非常大的损失或带来许多麻烦,所以用户对此项信息的关心程度非常高是符合实际情况的。由于其他五项个人人口统计学信息仅为用户个人的信息,不涉及到他人,而且即使泄露,一般也不会对用户本身或他人造成较大损失,所以用户对这些信息的关心程度很低。此外,在网络世界中,为了更好更容易地与他人交流沟通,大部分用户都隐藏自己的真实姓名和年龄,所以对这两项信息的关心程度要稍微要高一些。

2.财务信息

从表3中可以看出,对于各类财务信息,用户均很关心,关心程度最高的是银行卡号,其次是个人工资、家庭收入、配偶工资和家庭信贷情况等隐私信息。

对于财务信息,不论在中国还是其他国家,网络用户都都非常关心。因为这类信息涉及到用户的经济情况,如果泄露,会对个人经济造成极大损失,尤其是银行卡号,在信息技术如此发达的时代,黑客等网络高手可能会根据用户的银行卡号来窃取用户的钱财,所以用户对银行卡号的关心程度在所有隐私信息中是最高的。至于其他四项财务信息,相对其他类的个人信息来说,关心程度也要高一些。在这四项信息中,值得注意的是个人工资这项信息,在五年前,中国人并不关心这项信息是否泄露,甚至很多人主动告诉他人自己的这项信息,但随着社会的进步、经济水平的提高和用户观念的转变,近几年越来越多的用户开始关心自己的这项隐私信息。

3.个人偏好信息

从表3中可以看出,对于个人的各项偏好信息,用户普遍都不关心。因为这类信息仅仅是个人的兴趣爱好,即使泄露,也不会对他人造成损失或伤害,一般也不会给个人带来影响,所以用户对这类信息的关心程度都很低。

值得注意的是,年龄在31-35岁之间的人,对自己的政治倾向和宗教信仰这两项信息的关心程度要高出其他信息许多(其他信息关心程度在0.8以下,而这两项信息均约为0.4)。这是因为,处于这一年龄段的用户,工作已经进入快速发展期,生活阅历又比较丰富,已经认识到政治问题和宗教问题可能会对自己的工作产生影响,所以对这两项信息的关心程度相对来说要高一些。

4.家庭信息

同样从表3来看,对于各类家庭信息,网络用户同样比较关心,但相比来说,更关心庭住址和家庭电话这两项信息。

从古至今,家庭对中国人的意义和影响都非常大,这类信息的泄露,极有可能会给用户及其家庭带来极大的麻烦甚至伤害,尤其是家庭住址和家庭电话这两项信息,直接关系到家庭的安全和稳定,所以网络用户在对各类家庭信息都很关心的情况下,对这两项家庭信息的关心程度要更高一些。

5.社会信息

对于个人的各类社会信息,从表3中可以看出,用户一般比较关心自己的网络聊天记录和个人移动电话这两项隐私信息,其次是个人e-mail地址,而对职业、单位地址和单位电话等隐私信息则不关心。

网络聊天记录这项信息,一般涉及到朋友或同事的隐私信息,如果泄露可能会给自己的人际关系带来影响,甚至影响到自己的工作,所以用户对这项信息的关心程度比较高。而个人移动电话的泄露会给个人带来很多麻烦(如经常接到骚扰电话或短信息),所以用户对这项信息的关心程度也比较高。

(二)各类用户对各类隐私信息的关心程度比较

在(一)中我们从总体上得出了网络用户对个人信息的关心程度,并对各类隐私信息的关心程度进行了简要分析。为了更进一步的了解各类用户对个人各项隐私信息的关心情况,笔者采用关联分类的分析方法得出了各类用户对各项信息的关心程度的规则。

使用关联分类分析方法会得出很多的规则,因为篇幅有限,根据网络用户的性别、年龄和学历的不同,仅列出有代表性的规则,并对产生这些规则的原因进行简要解释,希望能为进一步研究引起这些现象的深层次原因,如文化因素、社会环境、个人偏好等,提供有益的启发。

表格5到7中的用户类别用年龄、性别和学历三个属性来来划分,表示方法为﹡﹡﹡,左边﹡表示年龄段,中间的﹡表示性别,右边的﹡表示学历,如C1Ⅰ表示年龄在25到30岁之间、性别为男性的具有本专科学历的用户。 

1.不同年龄用户对隐私信息的关心程度

如2.1中所述,不同年龄段的网络用户的社会经历不同,随着年龄的增长,对事务的认识和看法也不同。针对这一现象,笔者从分析结果中找出了不同年龄的用户对隐私信息的关心程度的差别(见表5)。

规则1 年龄在25到30岁的女性用户比年龄在21到24岁的女性用户更关心年龄这项隐私信息。这是因为无论在中国还是西方国家,女性对年龄这项信息都比较敏感,尤其是年龄越大的人,对这项信息越敏感,所以得出了此项规则。

规则2 同样具有本专科学历的男性,年龄在25到30岁的人比年龄在21到24岁的人更关心个人工资、家庭收入和详细健康状况这三项隐私信息。在本问卷的被调查者中,约有三分之一的被调查者为在校学生,所以年龄在21到24岁的男性大部分为在校学生,而年龄在25到30岁的男性基本都为从事工作的人,处于这一年龄段的人一开始承担家庭的各项经济支出,所以对个人工资和家庭收入这两项信息更为关心。同时,由于健康状况可能会影响到自己的工作和家庭,所以他们对自己的详细健康状况这项信息的关心程度也比较高。

规则3 年龄在31到35岁的人比年龄在21到24岁的人更关心婚姻状况和家庭电话这两项隐私信息。由于前者基本都为成家立业的人,后者大都为在校学生,后者对婚姻和家庭尚未具体的理解和经历,所以后者对这两项信息的关心程度比较低是很正常的现象。

规则4 对于职业这项信息,网络用户都不关心,但相比来说,年龄在31到35岁的人比其他年龄段的人更关心。由于小于此年龄段的人一般都未开始工作,即使工作也是刚刚起步,而大于此年龄段的人一般工作年限已比较长,工作已经有了一定的基础并且比较稳定,而处于31到35岁的人正处于工作的重要阶段,所以对于这项信息比较敏感,关心程度也较高。

2.不同性别用户对隐私信息的态度

一般来说,男性和女性在人生观、世界观、价值观方面的差异都比较大,为了了解不同性别的用户对隐私信息的态度存在哪些方面的差异,笔者对结果进行了分析,得出以下规则(见表6)。

规则5 女性比男性更关心年龄、体重、详细健康状况和家庭情况。如前所述,中西方国家的女性对年龄、体重这些信息都很敏感,所以对这两项信息的关心程度比男性要高,至于更关心详细健康状况这项信息,是因为女性一般体质弱于男性,所以对该项信息更为敏感。此外,在中国,女性的家庭观念更强,所以对家庭情况这项信息也比男性更关心。

规则6 男性比女性更关心姓名、性别、家庭住址、家庭电话。一般来说,在网络世界里,女性要比男性更容易与他人沟通交流,而从姓名可以大致判断性别,所以为了更方便的在网络世界里与他人沟通,男性一般都隐瞒自己的性别,即对姓名和年龄这两项信息的关心程度比女性高;此外,无论在中国还是西方国家,男性一般要承担起保护保护家人的责任,而家庭住址和家庭电话这两项信息的泄露可能会给家人带来麻烦或危险,所以男性对这两项信息的关心程度比女性高。

规则7 年龄在25到30岁之间的男性比女性更关心家庭信贷情况这项信息,但年龄在21到24岁之间的具有本专科学历的女性却比男性更关心此项信息。处于前一年龄段的人一般为刚成家立业的人,在中国,历来有男人养家的传统思想,所以处于这一年龄段的男性要比女性更关心自己的家庭信贷情况;而处于后一年龄段的人大都为在校学生,而女性一般比男性心思更加细腻,对父母更加体贴,所以处于这一年龄段的女性更关心家庭信贷情况是出于对父母的关心。

3.不同学历用户对隐私信息的态度

不同学历的人,所受的教育程度不同,一般在对问题的认识深度等方面会存在一定的差异。笔者从分析结果中找出了不同学历的用户在隐私信息的关心程度方面的差异(见表7)。

规则8 具有本专科学历的女性比具有硕士学历的女性更关心身高这项信息,而后者更关心配偶工资和网络聊天记录这两项隐私信息。一般来说,女性对身高并没有男性关心程度高,但是对于具有不同学历的女性来说,在学历上具有优势之后,对身高这项信息的关心程度自然也就没有在学历上具有弱势的女性高;至于配偶工资这项信息,如果女性本身的学历比较高,一般都希望配偶的工资能更高,所以对该项信息的关心程度也就比较高;此外,由于在校学生在本次调查中所占比例比较大,而在校本专科学生一般将网络用于沟通交流和娱乐,而在校研究生除了将网络用于交流沟通娱乐外,最主要的一点是用于做研究,从网络聊天的内容价值来看,硕士研究生的聊天内容价值更高,更需要保密,所以出现具有硕士学历的女性比具有本专科学历的女性更关心网络聊天记录这项隐私信息。

四、讨论

笔者采用问卷调查的方式获得了用户对于自身隐私信息的关心程度,并采用关联分类的方式分析了各类用户对于各项隐私信息的关心程度的差别,分析结果验证了引言中提出的两项假设。

如前所述,对于网络隐私问题,研究的人很多,但主要集中在隐私保护技术、隐私关心和隐私行为之间的关系或隐私和信任的关系问题或隐私权问题上。笔者主要是从用户自身观念出发,旨在了解用户到底对自身的哪些信息比较关心。此结论可以为电子商务网站服务,网站在了解用户关心的各项信息后,可以加强对这些信息的保护,从而提高用户对网站的信任水平,给网站带来巨大商机。但是尚存在一些问题,一是调查的信息项仅26项,有许多信息没有调查;二是样本仅350人,且样本年龄跨度小(如调查的年龄主要集中在20-35岁之间),涵盖的范围不够宽;三是在分析用户对信息的关心程度时仅采用频数分析,结果可能存在不合理的地方;四是关于各类用户对各类信息的关心程度的差别仅得出一些结论性的结果和简单的分析。

目前,关于隐私问题的研究越来越多,也越来越深入。但仍有许多问题值得进一步研究:(1)对本文未作调查的个人隐私信息需要调查研究,得出用户对这些信息的关心程度(本文只是对小部分信息进行调查,不完全,还需要进一步做详细的研究);(2)虽然由调查结果得出的规则可以看出用户对于各种信息的关心程度是不同的,但是对产生这些规则的圆满解释还需进一步的研究;(3)得出用户对于各项信息的关心程度之后,电子商务网站如何利用这些结果提高用户的信任水平也是值得研究的内容之一。

参考文献

[1] Forrester Research(1999). Post-web retail (September) [R/OL]. forrester.com/

[2] Harris and Associates Inc., Westin, A., 1998. Ecommerce and privacy: what net users want. Privacy and American Business and Pricewaterhouse Coopers. LLP. Available online at: pandan.org/ecommercesurvey.html. Accessed on 20 June 2005.

[3] Jupiter Research. Seventy percent of US consumers worry about online privacy, but few take protective action [EB/OL], 2002. jmm.com/xp/jmm/press/2002/pr_060

[4] Harris, 2004. National Survey on Consumer Privacy Attitudes. Available online at: epic.org/privacy/survey/S, accessed on 22 August 2006.

[5] PC world survey, 2003. Available online at: pcworld.com/article/id,112468-page,1/article.htmlS, accessed on August 22, 2006.

[6] Statistics Canada, 2006. Available online at: ca.today.reuters.com/news/newsArticle, accessed on August 22.

[7] Klein, S.,. The privacy debate: this time it's personal. The Guardian newspaper, April 26. 2004.

[8] Vise, D.,. Fears over Big Brother stalked Gmail. The Sunday Times news paper. Available online at:[EB/OL]business.timesonline.co.uk/article/, accessed on 8 December 2005.

[9] Carina Painea, Ulf-Dietrich Reipsb, Stefan Stiegerc, Adam Joinsona, Tom Buchanan. Internet users' perceptions of 'privacy concerns' and 'privacy actions' [J]. human-computer studies2007.65(526-536).

[10] Chang Liu, Jack T. Marchewka, June Lu, Chun-Sheng Yu. Beyond concern-a privacy-trust-behavioral intention model of electronic commerce[J]. Information & Management 42 (2005) 289-304.

[11] Huberman B, Adar E, Fine L. Valuating Privacy [J]. IEEE SECURITY&PRIVACY, 2005: 22-25.

[12] Thabtah F, Cowling P, Hammoud S. Improving rule sorting, predictive accuracy and training time in associative classification [J]. Expert Systems with Applications, 2006(31): 414-426.

[13] Liu B, Hsu W, Ma Y. Integrating classification and association rule mining [C]. Proceedings of the Fourth International Conference on Knowledge Discovery and Data Mining (KDD-98), 1998.

[14] Antonie M, Za?ane O, Coman, A. Associative classifiers for medical images [M]. Lecture notes in artificial intelligence 2797, mining multimedia and complex data. New York: Springer, 2003, 68-83.

第3篇

关键词:信用评分;申请评分;行为评分;利润评分;经济环境

中图分类号:F014.5文献标识码:A文章编号:1003-949X(2008)-06-01-03

个人信用评分研究从技术层次上来讲,主要经历了三个阶段,从简单的分类模型到预测评分模型,再到决策评分模型。而从评分的类型上看,主要分为四个类型,即申请评分、行为评分、利润评分以及考虑经济环境因素的信用评分。

一、申请评分(Application Scoring)

授信机构接受客户信用申请时,利用客户提交的申请表中的特征变量建立评分模型得到申请者的一个信用值,将该值与事先设定的标准值相比,判断该申请人逾期的可能性,从而决定是否授出信用及授信额度。这样的信用评分,称为申请评分。

建立评分模型可以运用的方法非常多,传统统计学方法有判别分析、线性回归、Logistic回归等;非参数方法有最近邻方法等;运筹学方面则主要采用线性规划方法。随着信息技术的发展,近年来许多数据挖掘的新方法如神经网络、决策树、遗传算法、专家系统等陆续被引入信用评分领域中。

Durand(1941)首先将判别分析方法用于信用评分,正式系统的提出使用数理统计模型辅助消费者授信决策的观念,并将Fisher(1936)提出的判别分析法用来区分“好”的贷款和“坏”的贷款,从而对贷款的信用风险进行评价,这是个人信用评估从定性分析逐步过渡到定量分析的开端。

1958年William Fair & Earl Isaacs利用判别分析法建立了著名的FICO信用评分系统。Myers & Forgy(1963)采用判别分析和回归分析方法,利用零售信贷领域消费者信用申请表中的数据对财务公司的信用风险进行了预测。 Orgler(1970)首次将线性回归分析引入消费者贷款的信用风险评估,利用线性回归分析设计了一个评价未偿还贷款的评分卡。Fitzpatrick(1976) 、Lucas(1992)、Henley(1995)等也先后将这种方法用于构建个人信用评分模型。Myers & Forgy(1963)认为这两种方法对于降低商业银行等机构的坏账损失有很大的帮助。Reichert (1983)也发现运用这两种方法构建的个人信用评分模型在预测消费信贷风险时都表现出了很强的稳健性。Rosenberg & Gleit(1994)在他们的研究中也表示了与Reichert相似的赞同观点。但Eisenbeis (1977)认为只有在客户分类较少的时候,基于判别分析和多元线性回归方法建立的个人信用评分模型才会有好的效果。

Wiginton(1980)首次尝试了在信用评分模型中使用Logistic回归方法,并与判别分析法进行了比较。但由于Logistic回归法没有变量正态性假设的要求,因此被学者认为是最适合发展信用评分模型的理论。并且由于该法使用的前提假设少,建立的个人信用评分模型具有相当的准确性和稳定性,因此成为了设计个人信用评分模型的主要方法,并且延续至今。

最近邻分析方法最先是由Fix & Hodges(1952)提出的,它是一种标准的非参数分类技术,通常被用来解决概率密度函数的估计和分类问题。它的思想很简单,就是把预测目标分为两类,当一个新的预测目标加入时,就将其并入最邻近一类中。Chatterjee & Barcun(1970)首次将最近邻法用于个人信用评分模型。Hand(1981)利用家庭贷款的数据对最近邻法与决策树进行了比较,结果最近邻法得到了相当高的预测精度。

Mangasarian(1965)第一个意识到可以将线性规划方法应用于分类问题。但是直到Freed & Glover( 1981a ,b)的文章发表以后,才引起了更多人的兴趣。此后,有关的研究文献大量涌现。Joachimsthaler & Stam(1990)就这一领域的70多篇文献进行了综述。有些学者则对统计学方法与线性规划方法的效果进行了比较,尽管在Nath ,Jackson & Jones(1992)的研究中认为统计学方法要比线性规划方法好。

1990年Odom(1990) 首次将神经网络方法引入信用风险评估中。Desai等(1996,1997)、West(2000) 等人使用神经网络方法构造了个人信用评分模型,并通过实证分析验证了在各种特征变量呈复杂的非线性关系的情况下,神经网络方法具有明显的优势。

决策树方法,也叫分类树或递归分割法,通过使用一种分割方法,将原始样本集递归分割成不相交的子集,目的是使期望损失达到最小。最早将决策树方法用于信用评分的研究是Makowski(1985)。 Coffman(1986)将决策树方法与判别分析方法进行了比较,发现当变量存在相关性时,决策树方法的表现较好。Carter & Catlett(1987) , Mehta(1988)等把这一方法应用到信用评分领域。

遗传算法是对一个问题的潜在解的种群进行系统的搜索,使得与解决问题相近的解保留在候选解中的可能性比其他解要大。遗传算法最早是由Holland(1975) 提出的。Albright(1994)首次将遗传算法应用于信用联盟评分卡的开发。Michalewicz(1996)提出了一些启发性的规则, Yobas, Crook, & Ross (1997)运用遗传算法并使用一个不同的函数对建立信用评分模型作了探讨。

专家系统是仿效专家的决策行为的过程的集合,它由自然语言组成,将专家的意见汇入计算机中,专家系统能够提高预测“坏”客户的准确性。主要的研究有Zocco(1985) , Davis(1987) , Leonard(l993a,b)、 Tessmer & Richey(1997) 等。Davis, Edelman & Gammerman (1992) 将Bayesian专家系统用于信用卡申请者的分类问题,并将结果与神经网络方法的结果进行了比较。Talebzadeh, Mandutianu & Winner (1994)依据专家系统设计出了抵押贷款的个人信用评分模型。Leonard (1993)则利用专家系统成功预测了信用卡用户的违约率。Hand, Mcconway, & Stanghellini(1997), Sewart & Whittaker(1998)等则论述了运用绘图的方法可以更容易确定个人信用风险的全部因素。

二、行为评分(behavioral scoring)

一般信用评分模式只考虑申请者本身的条件是否良好,未考虑外在环境变化。行为评分是一种统计专门技术,它是在一般信用评分的基础上考虑到时间因素发展而来的。研究的主要目标是通过预测现有授信客户的未来行为帮助借贷机构在管理客户时作出更好的决策。

行为评分模型主要分为两种方法,一种是申请评分模型和额外信息变量的组合,另一种是建立客户行为的概率模型。根据估计参数信息的获取方式不同,后一种方法又分为两类,一是从以前的客户中抽样,二是使用贝叶斯方法,即根据顾客自己的行为更新公司对客户的信任度。概率模型本质上是马尔可夫链,顾客可以从一个状态跳到另一个状态。

有关第一类行为评分的研究有:Cyert, Davidson & Thompson(1962) 用马尔柯夫链方法研究在贷款到期以后的不同时期,预计不可回收的贷款数目(C-D-T模型)。后来不少学者对C-D-T模型进行了修正。Van Kuelen et al. (1981)的主要修正在于考虑了过期账户的部分还款事实。Corcoran (1978)指出如果对于不同特征的账户给出不同的转移矩阵,系统将会更加稳定。Fryman et al. (1985)区分了移动者(movers)和停留者(stayers)这两种客户类型,发现后者更倾向于维持现有状态。Banasik et al. (1996)的研究指出如果对客户群体的分类不是足够清晰,在实际应用中得到的信用评分并不十分有效。

关于第二类行为评分的研究,最早基于Bayesian定理的概率模型是Bierman & Hausman( 1970)提出的。这一模型中,还款概率不是根据以前客户的样本得出的,而是被看作一个参数满足Beta分布的Bernoulli随机变量。Dirickx & Wakeman(1976)以及Srinivasan & Kim (1987)分别对该模型做了扩展。Thomas (1994)将这一模型进行了修正,他不仅把还款概率作为随机变量,还把最大可能的还款金额也作为随机变量,根据已经还款的情况,这些随机变量不断被按Bayesian方法修正。

三、利润评分(profit scoring)

个人信用评分模型的研究目标由客户违约率最小化向公司从该客户赚取利润最大化转变, 是国外个人信用评分模型研究的前沿之一,也是信用评分领域近几年来的研究热点。这方面正在尝试的方法大体上可以分成以下四种。

第一种是在现有的评分模型上建立的,估计违约率、交易量、接受和损失的比例,并根据不同测度下的得分对总体进行细分,对不同的群体定义利润。Oliver(1993)首先使用该方法,并考察如果顾客有了“交易利润得分”和“违约得分”,那么决策规则是什么的问题。 Fishelson-Holstine(1998)讨论了运用利润的两种类型来细分顾客的问题。Li & Hand (1997)则建议不估计最终的利润,也不直接估计违约标准,而是估计中间变量,如节余、购买额等,然后使用这些因素估计最终的收入。Hand, McConway & Stanghellini(1997), Sewart & Whittaker(1998)认为应该根据违约率、交易量、接受和损失率来综合考虑利润。

第二种类似于信用评分中的回归方法,把利润表达成申请表格中定性变量的线性函数。Lai & Ying(1994)进行了这方面的研究。

第三种是使用马尔可夫链方法来进行行为评分,以开发出更精确的消费者行为随机模型。Cyert et al (1962)对一个产品案例的利润进行了建模分析,当这些方法用于估计相同产品的顾客群体的坏账准备金时,结果表明应用非常成功。

第四种是成功地处理遗失数据的一种统计建模技术。人们试图根据有限的数据来估计消费者的长期利润。Narain (1992)是第一个建议人们在信用评分上使用该方法的学者,而Banasik et al (1999)的论文显示人们也可以使用竞争风险的思想来对消费者什么时候会违约和什么时候会预先付款进行估计,这样在一个分析中可以同时考虑违约率和流失率。Stepanova和Thomas(2001)利用PHAB模型进行行为评分研究,结果显示该模型在预测风险和预测利润两个方面都有很好的表现。Stepanova和Thomas(2002)研究了比例风险模型(即Cox模型)的三种扩展形式,研究表明该模型不论在预测风险还是在预测利润方面都非常有效。他们还提出了三个改进:在变量属性分类方面提出了coarse-classifying的分类方法;在模型拟合度的检验上提出了多个诊断方法;在数据处理上应反应其变化。Baesens, Stepanova和Vanthienen(2003)提出了几种神经网络生存模型,认为神经网络生存模型克服了比例风险模型要求输入函数形式是线性的缺点,并分别用神经网络生存模型与传统的比例风险模型的性能进行了比较。

四、考虑经济环境因素的信用评分

一般的信用评分模型中,都没有考虑经济环境等外在因素的影响,但经济周期等宏观经济变量无疑与客户违约率存在着密不可分的关系。随着信用评分技术方法的日益丰富以及计算机通信技术的迅猛发展,使得把经济环境因素整合到信用评分模型中成为必要和可能。其研究的主要目标是通过将经济环境变量、申请表特征变量和现有客户行为变量三者共同引入评分模型,以使得考虑的因素更充分,模型更加稳定,生命周期更长。

Crook, Hamilton & Thomas( 1992)证实了当经济处于衰退期时,即使信用历史良好的顾客也会出现违约的情况。Zandi(1998)调查了美国90年代的情况,认为违约率上升的主要原因在于信用标准的降低,因为金融机构为了争取信用卡客户和国内的贷款人,调低了他们的授信界限。关于个人破产对经济变量的回归分析表明,经济状况的确对违约有显著的影响。

构造同经济环境、申请表变量和消费者行为相联系的更严格的模型的一种方法是使用图形方法和贝叶斯学习网络。Sewart & Whittaker (1998)以及Hand et al (1997)指出这些技术对于检验自变量和因变量间的关系非常有用。Fung指出,使用模拟和马尔可夫的思想对信用评分的内容可以拟合得很好,由此分析可得到一个评分模型。

五、结论

个人信用评分的研究目标和方向一直在不断发生着变化,当前研究的重点是将风险管理目标从客户违约可能性最小化调整到如何使公司从该客户赚取的利润最大化。另外,信用评分的目的也从最初的评估违约风险,逐步扩大到评估响应、使用、保持、流失、负债管理、以及欺诈评分。这也为今后这一领域的研究指明了新的方向和道路。

参考文献:

[1]Capon, N, Credit Scoring Systems: A Critical Analysis, Journal of Marketing,1982,46:82-91

[2]Srinivasan V.and Kim, Y .H. Credit Granting: A Comparative Analysis of Classification Procedures. Journal of Finance,1987,42:665-683

[3]Hand, D. J. Discrimination and Classification. John Wiley, Chichester,U.K,1981

[4]Henley, W .E and Hand, D. J.A k-nearest Neighbor Classifier for Assessing Consumer Credit Risk,Tire Statistician, 1996,45:77-95

[5]Desai, V. S.,Crook, J. N. and Overstreet, G. A. A Comparison of Neural Networks and Linear Scoring Models in the Credit Environment. European Journal of Operational Research,1996,95:24-37

[6]Carter, C and Catlett, J. Assessing Credit Card Applications Using Machine Learning, IEEE Expert Vol. Fall,1987:71-79

第4篇

关键词: 透射图像; 模式识别; SVM; 级联分类器

中图分类号: TN919?34; TP391.41 文献标识码: A 文章编号: 1004?373X(2015)06?0101?04

New and old banknotes′ classification based on transmission images

QI Lei, REN Ming?wu

(School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094, China)

Abstract: Classification of new or old banknotes is a important function in the banknote sorter. The transmission image is adopted in this paper to detect new or old banknotes. It is different from the traditional new or old banknote detection based on reflection images. According to the new or old degree of banknotes, all banknote samples are divided into three grades. The new or old banknote detection method based on gray level image brightness and pattern recognition method are used respectively. The histogram distribute of transmission image is used as feature of new or old banknotes. The KNN and SVM classifier are employed to carry out classification. A new cascade classifier which combines SVM and KNN is put forward. Test proves the new cascade classifier is more effective than SVM and KNN in detection of new or old banknotes.

Keywords: transmission image; pattern recognition; SVM; cascade classifier

0 引 言

纸币清分机是一种集光机电磁于一体的高端金融现金处理设备,其主要功能是对纸币进行面值、面向、新旧程度及纸币序列号的识别。纸币清分机挑选适合在市场中流通的纸币、高效地代替了人工选择可流通纸币的工作。当纸币流通时间过长时,表面会出现粗糙、模糊、磨损等现象。过旧的纸币影响了纸币的真伪鉴别、冠字号识别等,导致货币在市场中的流通带来了不便。根据中国人民银行的《不宜流通人民币挑剔标准》,过旧的纸币不宜流通,因此纸币清分机中需要具有检测纸币新旧的功能来满足这样的需求。

早期国外曾根据纸币在清分机中与传送带的摩擦声音来判别新旧[1],但该技术已被数字图像技术[2]所代替。目前,国内纸币清分机产品多采用基于数字图像技术做相关研究[3]。纸币新旧识别成为纸币清分算法的核心和难点,而且新旧等级分的越多,难度越大。目前国内外现有的纸币新旧检测方法有基于纸币反光强度的新旧判别[4?5],基于多光谱彩色图像的新旧判别[2],基于标准图像进行灰度直方图匹配来判断纸币新旧[6] 等。目前,对于纸币的新旧检测大多基于反射图像的亮度。近年来也出现了将纸币的新旧检测转换为模式识别的问题,首先提取纸币图像上的有效特征,然后使用分类器来进行新旧识别[7?8]。

本文将纸币的新旧程度划分为3个等级,使用纸币的透射图像对纸币进行新旧判断,分别采用了纸币透射图像平均亮度划分图像等级和传统的模式识别的方法,提取了纸币透射图像的灰度直方图分布作为纸币新旧检测特征,并分别采用了KNN(k近邻),SVN(Support Vector Machine支持向量机)分类器,并提出了一种简单的级联分类器。

1 图像数据说明

本文通过人工划分的方式将100元人民币划分为新旧程度不同的3个等级,并且对于新旧程度不同的纸币分别收集了170张,其中100张作为训练样本,70张作为测试样本。将所有收集得到的纸币采用图像传感器进行双面采样,获得两张图像,白背景图像中的奇偶行分别对应纸币的透射图像和反射图像,黑背景图像中的奇偶行分别对应图像的反射图像和彩色图像如图1所示。本文只使用了纸币的透射图像,只需要将白色背景的图像提取出来,无需判断纸币图像的正反面。本文采集到的所有纸币透射图像都已确定4个角的坐标位置。

<E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T1.tif>

图1 原始采样数据分割

2 基于图像亮度的纸币新旧检测

目前,针对于纸币的新旧检测提出的大多数方法都与纸币的亮度有关,因为新旧纸币在图像采集的时候反光的强弱不同,所得图像的明暗有差异,因此可以根据纸币图像的亮度判定纸币的新旧等级。常用的方法有使用纸币空白区域的平均亮度,纸币反射图像某固定区域的平均灰度值。使用反射图像进行新旧检测时,必须先确定纸币图像的面向,还要定位到纸币的固定的区域。对于纸币透射图像,无论采集到的图像是纸币的正面或反面,所得的透射图像都一样,所以采用纸币的透射图像就不需要检测纸币的面向。采用图像的部分区域进行检测时,当此区域存在涂污时,对纸币的新旧检测结果产生影响。本文采用完整的纸币透射图像亮度的平均值检测纸币的新旧,具有更好的鲁棒性。

在所有训练样本和测试样本中,已经准确标记了纸币的4个顶点的坐标。这样就可以得到纸币边缘具置,可以利用行扫描,来统计每张纸币的所有点的灰度值的和,然后求得其平均值,根据平均值与自己设定的标准进行比较就可以得到纸币的新旧等级。但由于纸币在流通的过程中会出现磨损,完整的纸币图像经常存在一些噪声,例如对于过旧的纸币中往往存在细小的孔洞区域和图像边缘检测并非很精确(会残留一些白色背景区域),这就导致了所统计的透射图像的像素点中存在白色的噪声区域如图2所示,因此首先统计纸币透射图像的灰色直方图,然后将根据纸币图像的直方图去除亮度前%α的点和后%α的点,最后计算所有剩余像素点的平均灰度值。

<E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T2.tif>

图2 原始图像

基于纸币透射图像平均亮度检测新旧,具体步骤如下:

(1) 统计训练样本中新旧程度最新的样本(本文为等级1)纸币透射图像的灰度直方图,并去除最亮的前%α和最暗的前%α,计算每张纸币的平均亮度,最后计算所有样本平均亮度设为[vmax]。同理计算得到训练样本中新旧程度最旧样本(本文为等级3)的平均亮度设为[vmin]。

(2) 统计待检测的样本的灰度平均值,方法同(1),得到纸币透射图像的亮度为[v]。

step3判定新旧等级,根据以下公式:

[d=v-vminvmax-vmin 等级1, d>t1等级3, d<t2等级2, 其他]

式中[t1]、[t2]根据多次实验获得的阈值。

3 基于模式识别方法的纸币新旧检测

纸币的新旧检测除了采用图像的整体平均亮度值,近年来也出现了将纸币的新旧检测转换为模式识别的问题,例如文献[9]基于BP?LVQ神经网络的纸币新旧识别算法研究,首先提取纸币图像的新旧特征,然后将特征送给分类器识别,得到识别结果,具体过程如图3所示。

3.1 特征提取

纸币图像的新旧特征一般采用灰度直方图的分布统计,新旧纸币的差异不仅反映在纸币灰度图像的平均值上,在灰度直方图的分布中也有所差异。越新的纸币图像灰度直方图波峰靠后,越旧的纸币图像直方图波峰靠前。对于纸币透射图像也存在同样的表现如图4所示,分别为新旧等级一、二、三纸币透射图像直方图统计分布。统计每张纸币透射图像的直方图,得到256维的特征向量。所得到的特征向量中与基于亮度检测新旧具有同样的问题,图像中的最亮和最暗区域存在一定的噪声,使用上述相同的方法去除亮度前%α的点和后%α的点后统计直方图,得到256维纸币新旧特征,并归一化特征向量。

<E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T3.tif>

图3 模式识别方法的流程

<E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T4.tif>

图4 不同新旧程度的直方图

3.2 KNN

K近邻法(K?nearest neighbor,KNN)是由Cover和Hart在1968年提出的[10],它是最近邻法的推广形式,其主要的决策方法也是类似的,当k=1时就是最近邻法。K?近邻法是通过找到与待识别样本点最近的k个样本点,根据这k个训练样本的类别,通过多数表决等方式进行预测。因此k近邻法不具有显示的学习过程。k近邻法实际上利用训练数据集对特征向量空间进行划分,并作其分类的“模型”[11],K近邻法中的距离度量一般选用欧式距离。

假设训练样本一共有[N]个,并且分为[n]个类别分别为[w1,w2,…,wn],待识别样本为[x],在[N]个样本中找出与[x]最近[k]个样本,假设这[k]个样本中来自[w1]类的有[k1]个,来自[w2]类的有[k2]个,以此类推,来自[wn]类的有[kn]个,其中[k=i=1nki],定义判别函数:

[gi(x)=ki, i=1,2,…,n]

判别决策规则:如果

[gj(x)=arg maxi ki , i=1,2,…,n]

则待识别样本[x∈wj]。

3.3 支持向量机

支持向量机(Support Vector Machine,SVM)是Cortes和Vapnik于1995年首先提出的[12],支持向量机就是能够找出超平面并把空间中的样本进行分类的问题,使其间隔最大化。该方法是基于结构风险最小化原理找到最优决策超平面从而实现分类。假设有训练样本集

[T={(x1,y1),(x2,y2),…,(xN,yN)},xi∈RN,yi∈{-1,+1}]

式中:[xi]为第i个特征向量,[yi]为[xi]的类标记,当[yi=+1]时,[xi]为正实例,当[yi=-1]时,[xi]为负实例,[(xi,yi)]称为样本点。假定训练样本集是线性可分的,学习的目标是找到最佳决策超平面,能将实例分为不同的两类。分离超平面方程为:

[w?x+b=0]

分类超平面将特征空间划分为两部分,一部分是负类,一部分是正类,法向量[w]垂直于超平面并指向正类部分。

一般情况下,当可知训练样本可以线性分开的时候,则几何空间中存在了无穷多个分类超平面可以将训练样本分开。但是支持向量机利两个平行向量之间距离最大化求得了最优的分类超平面,这时的解是惟一的,图5为样本在线性可分情况下的支持向量示意图。

<E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T5.tif>

图5 SVM线性可分

从图5可以看出,相同的样本训练机可以有不同的划分,(b)图代表着线性可分支持向量机,其中虚线代表最优的分类超平面,与分类超平面最近的样本点称为支持向量。从图5中可以看出,此时两条实线之间的间隔最大。对于线性不可分的样本,可引入松弛变量加以解决。对于SVM分类器进行训练就是求解[w]和[b]的过程,具体过程参考文献[13]。

有时分类问题不是线性可分的,这时就不能用线性可分支持向量机来解决问题,如图6所示。

<E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T6.tif>

图6 SVM线性不可分

非线性问题的实质就是把能够将其转化成线性问题。所用的方法,就是构造一个非线性变换,将样本点的特征从一个低维线性不可分空间映射到一个高维线性可分空间。这里,就引入了核函数的概念。

设[χ]是输入空间,H为特征空间,如果存在一个[χ]到H的映射[φ(x):χH]对所有的[x,z∈χ]都成立,函数[K(x,z)]满足条件

[K(x,z)=φ(x)?φ(z)]

则称[K(x,z)]为核函数,[φ(x)]为映射函数,[φ(x)?φ(z)]为[φ(x)]和[φ(z)]的内积。

若直接将输入数据映射到高维空间可能出现维度爆炸现象,可采用核函数在低维空间进行计算,不需要显示的写出映射后的结果,其处理后的结果与高维映射等效。

3.4 级联分类器

为得到更高的纸币新旧检测的准确率,本文设计了一种级联分类器SVM?KNN来判定纸币新旧等级如图7所示,第一级分类器采用SVM,第二级分类器采用KNN,首先使用训练样本对SVM分类器进行训练,得到SVN分类器的模型参数。

当对待检测样本[x]进行分类时,先经过SVM分类器进行分类,获得分类概率最大的两类分别为[w1],[w2],概率分别为[p1]、[p1],当[p1-p2<T](其中[T]为设定阈值)进入下一级分类器KNN,分类得到分类结果,否则直接在本级分类器中分类,分类结果为[w1],[w2]中可能性最大的一类。

<E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T7.tif>

图7 级联分类器

4 实验结果与分析

本文将纸币新旧程度人工划分成三个等级,一共有300张纸币透射图像用于训练,210张纸币透射图像用于测试。其中每个等级纸币透射图像分别有100张训练样本和70张测试样本,本文分别实验了基于透射图像亮度的新旧判别和传统的模式识别方法,本文采用纸币透射图像灰度直方图的分布作为新旧判别的特征,使用了KNN,SVM,和级联分类器分别实验。基于透射图像亮度检测纸币新旧时参数α,[t1],[t2]分别设为5,0.65,0.2。SVM分类器使用了台湾大学LIBSVM[14],并选用RBF核,阈值[T]设为0.2。实验具体结果如表1所示。

表1 实验结果

实验结果表明在检测纸币的新旧等级实验中使用模式识别的方法明显优于使用图像亮度特征的方法,将SVM分类器和KNN线性级联使用的效果要优于它们单独使用,由于人工选择纸币新旧程度还存在一定偏差,在一定程度上也影响了新旧检测的整体结果。经试验分析误识别结果一般为相邻的两类新旧等级之间。

5 结 语

与传统使用纸币反射图像检测新旧等级不同,本文使用了纸币的透射图像对纸币的新旧等级进行检测,分别采用了基于图像整体平均亮度的方法和传统的模式识别方法,选用纸币透射图像灰度直方图的分布作为纸币新旧判别特征,分别使用了KNN,SVM和SVM?KNN线性级联的分类器。由于人工划分纸币新旧等级存在一定的误差,对于具体的新旧等级判别的界定比较模糊,如何解决这些问题并提高分类等级的准确性是本文后续研究的重点。

参考文献

[1] TERANISHI M, OMATU S, KOSAKA T. Neuro?classification of currency fatigue levels based on acoustic cepstrum patterns [J]. JACIII, 2000, 4(1): 18?23.

[2] 李朝.纸币清分机图像处理系统研究[D]. 湘潭:湘潭大学,2012.

[3] 谭家国.纸币图像高速采集系统设计[D].鞍山:辽宁科技大学,2012.

[4] 魏巍.CF1000型纸币清分机图像识别系统的设计与实现[D].哈尔滨:哈尔滨工业大学,2011.

[5] 郭玉佳.纸币图像处理技术研究[D].哈尔滨:哈尔滨工业大学,2009.

[6] 许万征.纸币多光谱图像分析方法[D].哈尔滨:哈尔滨工业大学,2010.

[7] 李庆峰.基于图像处理的纸币清分系统关键算法研究[D].北京:中国科学院,2006.

[8] 魏军.纸币动态检测识别算法研究[D].哈尔滨:哈尔滨理工大学,2009.

[9] 王洪,陈丽,肖思宁.基于BP?LVQ神经网络的纸币识别算法研究[J].光学与光电技术,2010,8(4):64?67.

[10] COVER T, HART P. Nearest neighbor pattern classification [J]. IEEE Transactions on Information Theory, 1967, 13(1): 21?27.

[11] 李航.统计学习方法[M].北京:清华大学出版社,2012.

[12] CORTES C, VAPNIK V. Support?vector networks [J]. Machine Learning, 1995, 20(3): 273?297.

第5篇

关键词:压力测试;金融稳定性;模型和系统

中图分类号:F830.3 文献标识码:A

文章编号:1000-176X(2009)09-0057-09

一、引 言

风险价值(Value at Risk,简称VaR)是指在正常的市场环境下,在一定的置信水平和持有期内,衡量某个特定的头寸或组合所面临的最大可能损失[1]。与传统的风险衡量方法相比,VaR提供了一种考虑杠杆、相关性和当前头寸的组合风险的整体观点,被称为一种具有前瞻性的风险衡量方法。风险的数量化量度发展从灵敏度到波动性,再到下侧量度,经历了从简单逐步走向准确的过程。 VaR不仅取决于风险的绝对水平,也取决于管理者对风险的偏好(如设定多高的置信水平)以及风险期限的长度,这样VaR以最简单的形式将已知组合潜在的损失与发生概率结合成为单个数字,将多个风险暴露的效果综合起来,便利了金融机构和监管当局的风险管理和监管。VaR由于其概念简单,用一个简单的数字表示风险损失的大小,易于理解,被广泛应用于金融机构的资本配置、风险定价、绩效评估、风险报告和信息披露,并作为一种很好的风险管理工具在新巴塞尔协议中获得应用推广,正发展成为现代风险管理的标准和理论基础。目前关于VaR的系列研究成果集中于新巴塞尔协议中,代表性人物有 Arzner、Alexander、Jorion、C.Acerbi、Rogachev等。

然而这次发端于美国的次贷危机给全球金融经济体系造成的负面影响远远超过了人们最初的预期,2008年10月期的《全球金融稳定报告》指出,由于损失上升、资产价格下降和经济减速加剧,金融体系与更广泛经济之间发生更严重负面反馈链的风险成为全球金融体系稳定的重大威胁,完全可比1929年的全球经济大萧条。这次尚在变化中的全球性金融经济危机带给我们许多经验教训,其中重要的一条是对风险后果的前瞻性估计不足,低估了金融体系杠杆率下降的幅度,机械地套用监管比率,对金融体系的稳定性评估过于乐观。人们进一步认识到,在置信度内正常市场情形VaR风险估计是有效的,但超过置信度的低概率金融损失事件传统的VaR方法无能为力,极端市场波动或危机的例子使我们认识到仅仅用过去流行的商业条件基础上的监督和风险管理是不够的(例如新的危机可能包括过去未曾出现的跨市场的新风险),需要结合压力测试对金融体系的稳定性进行判断。

压力测试(Stress-testing)由于能模拟潜在金融危机等极端事件对金融系统稳定性的影响,近年来在国际金融组织和各国政策当局间获得了迅速的应用推广。自20世纪90年代初期以来,微观压力测试在国际银行业得到广泛应用,已成为银行等金融机构重要的风险管理工具。发达国家监管当局均要求或鼓励所属银行遵循巴塞尔银行监管委员会的建议规范进行压力测试的工作。IMF和World Bank在借鉴亚洲金融危机经验教训的基础上,1999年发起了金融部门评估项目(简称FSAP),首次将宏观压力测试方法作为衡量金融系统稳定性分析工具的重要组成部分。随后,在FSAP项目的协助下压力测试方法成为其成员国政策当局金融稳定性分析中广泛使用的工具,各国政策当局纷纷开发出自己的宏观压力测试系统,典型的有英格兰银行的TD测试系统、澳地利银行的SRM测试系统等。压力测试的理论和应用研究主要集中在各国央行系统的研究人员,在这一过程中IMF和世界银行起到了引领作用。代表性的人物有 IMF的Cihak、Swinburne等分析了微观压力测试与宏观压力测试的区别,并总结了IMF宏观压力测试系统演进历程[2-3];IMF的Dale F.Gray等利用风险调整的平衡表,研究了基于Merton模型的金融稳定性分析框架和压力测试方法[4];英国央行的Drehmann、Haldane剖析了英国宏观压力测试系统的构建方法和评测结果[5];奥地利央行的Ross等分析了该国宏观压力测试系统的构建框架。另外美国FDIC的Krimminger、欧央行的Lind、挪威央行的Moe、澳大利亚储备银行的Ryan、西班牙央行的Saurina分别研究了各国宏观压力测试系统构建经验,芬兰央行的Esa Jokivuolle研究了新巴塞尔协议要求下基于联合信贷损失的未来最低资本要求的压力测试;Sorge比较分析了不同宏观压力测试方法的应用。Goodhart、Summer、Tsatsaronis等研究银行间市场传染效应(contagion effects,又称domino effects)、反馈效应(feedback effects)、信贷衍生品市场发展引起的内生性风险和非线性影响等问题[6-8]。

我国目前已经开始了压力测试在金融领域的推广应用。2003年9月,中国银监会响应FSAP项目要求国内各商业银行开展利率变动、汇率变动、准备金调整、不良贷款变动对商业银行资本金和盈利的影响四个子课题的压力测试。2007年银监会再次组织各大商业银行到普华永道接受培训,学习敏感性压力测试技术,内容包括房地产贷款综合压力测试和个人住房贷款进行专项压力测试,这次测试成为不少国内银行进行的首次压力测试实验。我国从2006年开始《金融系统稳定性报告》,但报告缺乏压力测试内容,不利于对我国金融体系稳定性做出正确的评价,制定出符合实际情况的政策措施。在目前复杂多变的全球化金融经济体系中,国内的系列金融改革正在全面深入,许多制度措施的实施缺乏现成的经验可资借鉴,客观上需要我们采用新型的方法分析金融现象,做出前瞻性的正确分析,为我国的金融改革和经济发展提供正确的依据。

二、风险价值与压力测试

VaR产生的金融风险实践根源在于20世纪90年代初发生的一系列重大金融灾难(如发生在美国加州橙县的财政破产、巴林银行倒闭等灾难性事件),这些事件的共同教训是由于金融风险的监督和管理不力导致巨大损失。同时也使人们进一步认识到传统的风险管理方法已无法准确定义和度量新形势下的金融风险,因此1993年7月G30集团在研究金融衍生产品的基础上,提出了度量市场风险的VaR方法。VaR在理论上继承和发展了Roy安全第一(Safety First)准则模型的理念,该模型的决策规则是极小化投资组合收益小于给定损失水平事件的概率,与Markowitz收益―风险型投资组合模型的思路不同,安全第一模型给出了另类风险控制的思路,即对损失概率的控制,确定在给定概率置信水平内最坏情况下的损失。 VaR属于下侧量度,已经证明风险的下侧量度是对灵敏度与具有不确定性不利结局的波动性的整合。VaR只涉及可能产生损失的收益下侧偏差,而不涉及意外增益。下侧风险可以数量化地表示为在一定置信水平下单侧区间的边界值,只需考虑超过不利偏差的边界概率对应的下侧分位数。但是VaR在实际应用中也存在一些不足:(1)VaR模型的许多假定基于市场正常情形,无法实现市场极端情形下的风险损失刻画,由于例外事件发生的观测数据非常有限,对于市场的极端情形,基于统计分析视角的VaR难以实现数量化的精确分析。(2)当概率分布不连续时,VaR无法保证置信度的连续性和分位数的惟一性。(3)VaR度量的波动风险有可能是负数,意味着市场可以存在负的波动风险资产,这往往与现实不符。(4)无法有效估算选择权等非线性金融资产的风险损失。因此VaR并不是万能的,只有当使用者掌握了其限制条件后,VaR方法才是有用的。VaR描述了损益的潜在变化,目的并不在于给出最坏的损失情形,尾部的表现需要通过压力测试来进行分析。压力测试提供了关于极端情形的低概率事件对整个金融机构的影响信息,在很大程度上弥补了传统风险价值体系的不足。对于金融风险管理来说,除了考虑正常情况下的可能损失,更重要的是必须确保在极端的市场情形下,金融机构持有的金融资产不会引发金融机构破产风险,通过压力测试,可以发现金融机构在极端市场情形下的风险承受能力。因此,压力测试已经成为VaR风险管理体系不可或缺的组成部分,与风险价值方法构成了一个比较全面的风险分析体系,这些年来得到了迅速的发展。

根据IMF(2004)的定义,压力测试(Stress Testing)指一系列用来评估一些异常但又可信的宏观经济冲击对金融体系脆弱性影响的技术总称[1]。在微观领域,一方面,压力测试具有能评估某些小概率事件对银行经营或其所拥有的投资组合可能造成的影响的优势,可作为金融稳健性指标(如CAMELS)中风险度量工具VaR的重要补充;另一方面,压力测试能帮助金融监管当局更好地监管个别金融机构的市场风险和信用风险。为了有效衡量额外资本缓冲的规模,新巴塞尔协议要求银行对它们潜在的未来最低资本需求进行压力测试。根据新巴塞尔协议第一支柱的要求,如果银行用基于IRBA的内部评级法,至少要考虑温和衰退期的影响。新巴塞尔协议给出的温和衰退期的例子是2个连续的零增长期。FSA给出的是平均每25年一次的经济衰退。根据监管者的要求,压力测试的具体形式可以由银行自己确定。发达国家监管当局均要求或鼓励所属银行遵循新巴塞尔协议的规范进行压力测试工作。微观压力测试在国际银行业得到了广泛应用,已成为银行等金融机构重要的风险管理工具。在宏观领域,压力测试用来衡量冲击对金融系统稳定性的影响。与微观金融机构的压力测试相比,宏观金融压力测试有更广泛的覆盖面(即金融体系及其重要的组成部分),并用于不同目的(金融部门的监管和风险管理),基于最新的分析技术,更专注于传播的渠道(即一个机构的风险如何能够成为一个系统风险)。宏观压力测试并不意味着压力测试应以总体数据来执行,因为把压力测试应用到整个金融系统或大型机构可以掩盖应用于个别机构时所暴露的大量问题,这些问题可能导致金融机构的破产并蔓延到系统中的其他机构。因此在尽可能多的机构上进行压力测试是很重要的。我们不仅要分析总体结果也要分析总体数据结果的分散情况,宏微观压力测试往往需要结合使用。一般而言, VaR和压力测试风险估计不能相加。压力测试衡量资产损失分布中超过VaR值的部分,而风险价值方法是用来衡量资产将要经历的收益或损失,这些资产由一个或更多的基本经济因素决定其价值的具体变化。压力测试是VaR 方法的有效补充,两者共同构成了一个全面的风险管理体系。

三、压力测试与金融系统稳定性评估

压力测试已经成为宏观金融分析的重要组成部分。宏观金融分析包括对金融市场状况的监管和对宏观金融联系的分析,需要编制金融稳定指标来监测金融机构和市场的稳定性以及与之相对应的企业和家庭。金融稳定指标包括金融机构的总体信息和金融机构运行所在市场的指标, 为了便于汇编这些指标,国际货币基金组织已定义“核心”和“激励”两套金融稳定指标。所有核心金融稳定指标与银行部门相关,反映了银行在大部分国家金融体系中的优势地位。在激励金融稳定指标中还包括银行的附加指标、金融市场流动性指标、非银行金融机构和非金融企业部门(如股本的总债务)的指标、家庭部门(如家庭债务服务和主要支出)和房地产市场的指标。对于金融稳定指标分析的关键是它们的相互关系以及它们和其他宏观分析框架的关系。

金融稳定指标与压力测试通常共同使用来分析金融部门的稳定性。压力测试和金融稳定指标之间有许多重要的不同点,这些不同产生于它们在宏观分析中的不同作用。特别是压力测试能更清楚地说明冲击的潜在成本。压力测试冲击和模型基于判断和假设,必须适应于某一特定系统的特点,与编制金融稳定指标相比,不受制于统计学家们数据分析时所采用的严格标准,所以压力测试的结果与在金融系统真实条件下得到的金融稳定指标没有可比性。考虑到这些限制条件,压力测试和金融稳定指标提供了相互补充的风险分析方法。面对复杂金融系统,压力测试衡量的损失验证了金融稳定指标是否切实可行,压力测试作为其风险管理的重要组成部分,其结果可以描述成与市场风险金融稳定指标(如由于给定规模的变动所造成资本的损失)相比的一种形式。这种互补性反映了两者在分析水平上的密切关系。例如,从汇率波动压力测试中估计的直接损失可以近似地用汇率的变化乘以净开放外汇资产金融稳定指标。

宏观金融分析压力测试的重要性主要表现在三个方面:对宏观经济看法的整合、对金融系统作为一个整体的关注、对银行间风险评估方法的统一。不像大型银行进行的压力测试旨在衡量投资组合和各个银行的风险,宏观金融压力测试在对宏观经济和市场风险进行评估的基础上应用一种共同的情景来进行,这种统一的做法使结果有整体性,便于在整体系统水平上确定关键风险,并提供银行等金融机构间风险的可比信息。就政策当局而言,利用宏观压力测试可实现两方面的作用:一是和传统的CAMEL指标、早期预警系统等一起使用来识别需要重点关注和进行救助的弱势金融机构。二是实现宏观金融系统的监控,用于模拟分析小概率异常事件冲击对整个金融系统的影响,评估金融系统整体应对外来冲击的风险承受能力,提高对金融风险传导途径的理解(如危机传染),分析各种风险传导途径的相关性和重要性从而找到金融系统中的薄弱点和危机发生时的政策优先处理点,分析政策干预的成本等。

根据IMF和World Bank的金融部门评估项目(FSAP),金融稳定评估框架 FSAP通过三个层次评估金融体系是否稳健:一是宏观层次,衡量宏观审慎监督的效果。主要是通过编制和分析金融稳健指标判断金融体系的脆弱性和承受损失的能力,通过压力测试评估冲击对银行体系的影响。二是微观层次,判断金融基础设施是否完善。通过对照国际标准与准则,检验一国支付体系、会计准则、公司治理等是否完备。三是监管层次,评估金融部门监管是否有效。重点评估对银行、证券、保险、支付体系的监管是否符合国际标准。基金组织和世界银行在上述三个层次的基础上,形成对被评估经济体的金融稳定报告。

政策当局进行金融稳定性评估时会综合使用多种分析工具。其中,定性分析工具包括制度、结构和市场特征及监管框架、标准与准则等信息分析;定量分析工具包括金融稳健性指标(Financial Soundness Indicator,简称FSIs)、宏观和行业资产负债表分析、早期预警系统、压力测试等。在定量分析方面,压力测试对政策当局来说是重要的风险评估工具,能提供未来某种极端不利冲击影响的模拟信息,是金融稳健性指标分析的有效补充(如图1所示);金融稳健性指标和早期预警指标等能提供历史和现状的对比信息。

目前几乎在所有金融部门稳定性评估方案任务中都有对汇率风险、利率风险、信用风险、股票价格和房地产价格风险、流动性风险等的压力测试分析。另外,一些国家的金融部门评估方案任务中还包括商品价格风险的压力测试,这主要在商品贸易比较重要的发展中国家进行。(1)汇率风险。其中有一半计算它对单个机构或银行团体未平仓合约资产净值的影响,这反过来又校准了对资本的影响。大约40%的金融部门评估方案任务采用回归分析和蒙特卡罗模拟来确定汇率变动对信贷质量(不良贷款)的影响。汇率风险是由于汇率变动引起资产和负债价值出现损失的风险。它包括直接汇率风险和间接汇率风险,前者可以使用未平仓合约净值占资本的比例来评估,是金融稳定核心指标之一,风险直接,易于控制和管理;后者主要是由于汇率变动引起金融资产间出现高度非线性的风险,在这种情况下,基于银行开放程度详细分解基础上的压力测试是一种卓越的分析工具。 (2)利率风险。利率变动影响利息收入和利息支出,同时通过金融工具市场价格的变动来影响资产负债表。大多数金融部门评估方案任务中都有利率风险分析。由于数据的限制,大部分金融部门评估方案使用成熟的收入现金流方法。一些使用基于持续期和风险价值(VaR)的更先进技术。约有25%的金融部门评估方案任务由于没有获得成熟的持续期模型数据而利用收入数据简单计算收益风险。(3)信贷风险。信贷风险主要是指信贷资产质量出现非预期变化所带来的损失,是最重要的金融风险来源之一,信贷风险的全系统压力测试通常基于贷款业绩数据(如贷款收益率、不良贷款率)和借款人资料(如财务杠杆、利息覆盖率)两个方面进行。目前超过1/2的金融部门评估方案任务使用基于不良贷款的方法建立信贷风险模型。大约60%的任务使用特别不良贷款迁移模型。只有约30%的任务使用回归分析研究潜在的宏观经济冲击对不良贷款行为的影响。(4)股票和房地产价格风险。金融部门评估方案任务中大约有1/2测试了股票或房地产价格风险。在大多数情况下,股票价格风险压力测试包括在广义市场风险中,通过股票的未平仓合约指标来计算。房地产价格风险的压力测试包括:直接风险(投资于房地产);信贷风险(如贷款给房地产开发商);由房地产的抵押程度所产生的风险。产生于房地产抵押的风险认为与信用风险有关,它随着贷款与价值比率(即贷款收益与担保品价值的比率)和违约率的增加而增加。(5)流动性风险。流动性风险是资产不能立即变现以满足现金需求而产生的风险。设计流动性压力测试最具挑战性的一步是确定哪些资产通常具有流动性但在某个财政压力时期又不具有流动性。流动性风险压力测试的一种直接办法是让流动资产的价值按一定比例或数额变动。如可以根据银行以往的经验来确定该比例或数额,一般要求在资金缓慢流出而没有外部支持的情况下银行应该能够至少生存5天。流动性风险主要关注两种情形:一是关注银行的债务风险,这通常以银行最大的储户突然撤回其资产作为模型;二是流动性压力在银行间的传递。由于一家银行产生了流动性问题,从而引起另外一家银行的流动性变弱。国际货币基金组织(2003年)提供了可以作为压力测试的流动资产和债务的指引。和其他压力测试一样,不能忽视资产负债表外的资产(如衍生产品或银行扩大的贷款承诺)对流动性产生的重大影响。

四、压力测试在金融系统稳定性评估中的应用

国际货币基金组织和世界银行已经开始了金融部门评估规划FSAP(金融部门稳定性评估方案),它致力于评估其成员国金融体系的优缺点。这一项目下的评估迄今已涵盖70多个司法管辖区,并提供各种建议改善金融体系框架。压力测试从一开始就是评估金融部门稳定性的一个关键因素,它可以帮助确定监测金融系统稳定性所需数据的数量和性质,分析金融系统作为一个整体受到外部冲击的影响,提供一个独立核查风险潜在来源的方法并扩大对金融系统联系的理解。已有的经验表明,压力测试的类型需要适应不同国家的情况、金融系统的复杂性和数据的可用性。压力测试的宏观效果可以通过使用宏观经济模型(帮助校准选择的情景和为测试达成一致的假设)、对金融机构同业间影响的分析和参与各大金融机构的压力测试演习获得进一步的提高。压力测试主要包括三个方面:(1)敏感性分析,其旨在确定金融资产价格如何随相关经济变量(如利率和汇率)的变化而变化。(2)情景分析,其目的是评估在一定置信水平条件下金融机构的应变能力和金融系统的异常情况。(3)传染分析,主要考虑单个风险冲击如何传导至整个金融系统。

(一)压力测试的实施

基于宏观金融分析的压力测试可以被看做是一个研究系统关键风险的多步骤过程。一般而言,实施宏观压力测试主要包括以下6个步骤。

1.确定纳入测试的机构和资产范围

宏观压力测试首先需要考虑纳入分析的金融机构及资产范围:仅考虑大型银行机构,还是考虑包括外国银行、非银行金融机构、保险公司、养老基金;将哪些类别的资产纳入分析范围(对资产的选择部分依赖于需要分析风险的本质和数据可得性);对银行的风险暴露采用银行账面价值还是其他指标来衡量等,测试范围的选择决定了计算所需的数据。

2.识别主要风险因素

压力测试必须要检测存在于一国实际情形下与宏观经济风险有关的潜在冲击后果。因此,在压力测试设计过程中首先要讨论经济所面临的潜在风险,发现在特定的经济条件下,某些类型的冲击(例如利率增加或货币贬值)比其他类型的冲击更有可能发生,并且评估风险和风险是如何联系在一起的。压力测试的设计是一个反复的过程,因为一些原来确定的风险可能导致的影响相对较小,但如果有实质性风险的话,原来一些小风险可能导致很大的影响。然而影响金融体系的风险因素很多,不可能对所有的风险进行压力测试,需要我们集中力量关注金融体系的薄弱点,了解金融体系的内在脆弱性。一般来说,金融体系主要包括市场风险、信用风险和操作风险三大类,进一步可以细分为汇率风险、利率风险、信用风险、股票价格和房地产价格风险以及流动性风险等,对于不同的金融体系,这些风险因素的重要程度是不同的。

3.压力情景的设计与校准

对一个假设情景的模拟说明意味着这样的冲击:它比历史上所观察到的情况(或未发生)更可能发生或它在未来可能发生并打破传统结构。设计金融系统压力情景时需要考虑风险类别的选取(如市场风险、信用风险、流动性风险等),考虑单一冲击还是多重冲击(选择多重冲击处理较复杂,但能增强压力测试的预测力)、冲击参数的选择(价格、波动性还是相关性)、冲击的程度(历史还是假设情景)及时间长度等。对于金融系统风险的规模通常有两种确定方式,这两种方式对应于不同的压力测试计算方法:第一,比较典型的方式是在选定置信度后制定一个极端的情况并思考它对于金融系统的影响。我们称之为“最坏情况做法 ”,因为从效果来看,在给定置信度下该情况有最大的影响力。第二,不太常见的方法是选择一个对系统有影响的特定“临界值 ”并求系统在达到该“临界值”时所需要的最小冲击。压力情景设计时校准冲击的程度是关键点,设置得太高或太低可能使压力测试没有意义。一般而言,冲击的程度选取某段时间内风险变量最大的变动幅度或历史变动方差。还需要校准次轮效应(second-round effects),即原始冲击引起其他经济变量变动情况(如油价冲击可能影响GDP、利率、通货膨胀等),一般采用结构式或简约式宏观计量模型来分析冲击变量之间的相互影响。

4.风险来源的确定及其相关性分析

针对不同的风险进行压力测试时,需要估计这些风险被记录在机构资产负债表的哪个地方,了解金融系统可能产生损失的风险在哪里,尤其在较发达的金融系统中,还要了解衍生工具和证券活动风险转移的详细情况。对涉及到具体经济部门冲击的风险估计,可以从对金融机构替代活动风险的结果中得到(如信贷、股票、衍生产品、信用衍生产品、结构性产品、战略的长期投资、保险)。例如,一个重要经济部门产量的回落可以通过多种方式反映在压力测试中:主要有直接贷款、债券以及整个行业相关的信贷损失、由于投资所导致的该行业股票市场价格变动、由于冲击对工资和就业产生不利影响而导致相关的消费信贷和抵押贷款的增加、银行和保险行业资产负债表外的损失、由于冲击所产生的相应部门违约。

通过金融稳健性指标反映的各种风险因子间可能存在相关关系(如油价冲击极可能同时影响市场风险和信用风险)。处理这种相关关系时要求能综合考虑各种风险因子的统一分析框架,抓住重点简化处理。在许多银行业压力测试中,信用风险引起的损失占总损失的绝大部分,这就能简化用Logit或Probit概率模型进行分析。

5.金融机构间风险传染效应的压力测试

我们不仅要根据金融稳定性指标来反映宏观经济冲击对金融系统稳定性的影响,而且还要分析冲击传染的途径、微观主体间的交互反应等。政策当局通过单个金融机构的压力测试结果可以掌握冲击对金融体系的直接影响程度及其分布情况,但还必须展开传染效应分析以了解冲击的间接影响,以免出现“多米诺骨牌效应”和“羊群效应”。金融机构间压力测试使标准的压力测试得到补充,往往一家银行的稳定出现问题可能使系统内其他银行在国际市场上的融资产生困难,引发民众对整个银行体系的信心下降,导致系统内其他银行破产的风险。

银行间压力测试包括纯粹压力测试和综合压力测试,前者旨在回答系统中任何银行(或一组银行)的破产是否使其他银行的经营状况下降,它也可以用来表明潜在的流动性危机(因为银行不完全了解借款人的偿付能力)使其他银行削弱到何种程度(即使没有银行破产),指明哪家银行是系统性风险的潜在根源;后者着重于由宏观经济压力所引起的银行间传播,它首先把银行系统置于宏观经济压力的情况之下,如果没有银行破产,则需要增大宏观经济冲击,直到一家(或一组)最弱的机构破产,然后像纯粹压力测试那样计算银行间风险传染的影响。

银行间风险传染效应压力测试计算一般通过银行间的风险矩阵来实现(如表1所示)。矩阵中的每一行代表一家银行,行中每一项表示该银行与其余每个银行的全部银行间风险。

“纯粹”银行间风险传染压力首先假定有一家破产的银行(比如说银行1 )。破产可能由任何原因引起,例如欺诈行为。第一轮计算银行1的破产对其余每个银行的直接影响,并假设银行1不用偿还其银行间无抵押资产(或部分资产)。如果一些银行由于银行1的破产而破产,第二轮的计算将包括这些新破产的银行对剩余各银行的影响。如果第二轮之后有新的银行破产,这个过程可以在第三轮重复进行,如此类推。系统性风险的两项指标可以从纯粹银行间压力测试的结果中计算出来:(1)银行破产频率的指标,这是累积破产的银行数目与系统中银行总数的比率。(2)银行系统资本影响的统计方法(例如中位数,分布情况和四分位数)。具体来说,我们可以定义一个“系统性风险指数”,由系统中最重要银行的破产所引起的银行资本比率的平均减少量。这种方法可以计算该系统中的所有银行并根据它们在系统中的重要性来对银行分类。

6.基于压力测试结果的金融系统风险承受力评估

通过压力测试,政策当局可以清晰地发现金融体系的薄弱点,传染效应分析可以定量地判定金融机构系统的重要性,发现危机在银行间和实体变量间传染的渠道,不同银行机构间的交互反应,由于损失率上升引起评级下降从而融资成本上升的风险内生性问题,金融层面的影响结果(如银行借贷影响)又反过去影响实体经济层面的反馈效应等。在各传导机制的基础上分析损失分布和总体分布,将决定是否对问题金融机构进行救助,提高了政策当局决策的准确性和时效性。但是,压力测试的结果应解释为风险的指标而不是预告银行的破产,我们要记住它所建立的限制条件和假设,压力测试提供的信息与其他分析工具的见解要相互补充:尤其是对法律、体制、法规和监管框架的评估;对金融系统结构和关键风险的分析;金融稳定指标的实证分析。典型的压力测试认为银行是一个静态资产组合而不是积极的动态单元,然而对风险的彻底审查,必须考虑到银行可以动态适应环境冲击的事实。根据银行面临的各种冲击因素,这些措施可能增强或减弱初始波动带来的风险。为了了解在特殊情况下银行所面临冲击的结构,就有必要了解银行机构所处的环境,如银行的治理安排、法律、会计、税务、规章制度以及持有人如何应对银行在债券和股票市场可能采取的行动。

另外还要考虑银行维持损失的能力,虽然压力测试结果提供了金融风险漏洞导致的金融机构市值损失的估计,但是银行预定资产的重大损失没有反映在监管资本计算中,不但大量低级的贷款继续支付利息并且保持运作,而且如果市场压力暂时平息,它们又重新变得有价值。

最后还要讨论系统可能出现误差和不确定性的地方,为系统的进一步修正优化提供指导。

(二)压力测试模型和压力测试系统的实践

虽然压力测试方法应用时间较短,但在实践中得到了迅速的推广,已经成为政策当局金融稳定性分析工具的重要组成部分。宏观压力测试并不是采用宏观数据进行压力测试,宏观压力测试利用的基础数据主要还是微观数据,主要考虑微观测试结果如何加总,需要突出分析微观主体的交互反应、传染效应(contagion effects,又称domino effects)、反馈效应(feedback effects)等。目前主要有三种代表性模型:(1)Boss的网络模型。该模型的优势在于将各种风险因子和商业银行面临的各种风险(主要是市场风险和信用风险)统一在一个分析框架内,可操作性强和执行效率高(直接用商业银行资产负债表各资产账面价值数据进行分析),容易得出政策结论(结果用损失概率来表示,且能得到最后贷款人的干预成本(bailout cost))。其局限在于结构模型,没有模拟个体间的相互作用、激励和反馈效应,很难计算银行间的联合违约概率(PDs),基于资产负债表信息,不能有效反映信贷衍生品等表外资产交易对银行风险暴露的影响。(2)Goodhart的违约依赖模型。该模型的创新之处在于模拟银行间的违约依赖性及其稳定性含义,提出了非线性条件下分析银行间的联合PDs的新框架,更好地考虑了个体特征和激励问题。强调了微观宏观联系和压力测试中的棘轮效应、强调传染是金融危机的主要驱动力。其局限性在于计算量大(多家银行情况下多维的Copulas计算量较大),而且很难解释压力测试的结果。(3)Tsatsaronis的信用风险转移模型。该模型的优势在于考虑了信用衍生品等表外资产交易的风险测度,局限在于该模型发展还不成熟,尚未将各种风险因子影响整合为统一框架,还未进入实践应用领域。

总的来说,宏观压力测试对传染效应的研究尚处在探索阶段,还值得进一步研究。近年来经济和金融环境的改变引起了对宏观压力测试的新挑战:大型跨国金融机构(Large and Complex Financial Institutions,简称LCFIS)的活动跨国化,使得银行风险的评估和监管在金融市场全球化条件下进行;非银行活动的增加使得传统的采用资产负债表方法分析风险较困难;信用风险转移市场的迅速发展改变了金融系统风险动态化的本质,如对冲击的非线性反应等。

比较典型的宏观压力测试实践系统有IMF和World Bank的“金融部门评估规划”(Financial Sector Assessment Program,简称FSAP)、英格兰银行的TD压力测试系统、奥地利央行的SRM测试系统。其中后两者都是在FSAP压力测试系统基础上发展起来的。

(1)FSAP于1999年5月推出,源起于1997年的亚洲金融危机,目前已成为被广泛接受的金融稳定评估框架,该框架包括三种分析工具:金融稳健指标、压力测试(Stress Testing)、标准与准则(Standards and Codes)评估,压力测试是对金融稳健指标分析的有效补充。 FSAP压力测试系统是各国开发压力测试系统的参考基础。FSAP压力测试主要由信贷、利率、汇率、流动性、操作风险及风险传染模块组成。风险情景、影响指标的设计依赖于各国的宏观经济环境和数据可得性,截至2007年,FSAP共对80多个国家或地区的金融体系稳定性进行了压力测试。 在FSAP参与的项目中,情景测试占95%、考虑银行间传染效应的占38%、保险业压力测试占37%[5]。

(2)英格兰银行的TD压力测试系统集中于分析核心金融脆弱性在金融系统和实体经济系统间的风险传导渠道,实践中对数据要求很高,考察的风险种类也较多(包括了流动性风险),考察了风险的内生性(如违约率上升导致银行信贷评级下降、融资成本上升风险)、市场微观主体(居民、企业、政府、银行金融机构和非银行金融机构)间的交互反应和风险的传染效应、金融变量和实体经济变量间的反馈效应(feedback effects)等问题。该系统的实施步骤包括识别系统关键脆弱性、选择压力情景、估测脆弱性影响、估计整体影响和概率、评估总体金融系统稳定性风险、误差分析等。

(3)奥地利央行的SRM测试系统主要建立在Elsinger (2006)和Boss(2002)的银行间网络模型的基础上,银行机构间的联接点用银行间市场双边借贷头寸来反映。该模型只考虑了银行间简单的相互关系,对传染机制的考虑不多,没有考虑资产负债结构问题和由于银行评级变动引起的风险内生性问题,也没有考虑反馈效应问题,在实践应用中对数据的要求不是很高,操作性较高。

实践经验表明,压力测试可以帮助确定监测金融系统稳定性所需数据的数量和性质,提供了一种独立核查风险潜在来源的方法并扩大对金融系统联系的理解。目前一些中央银行已开始在金融部门评估方案指导下进行经常性压力测试演习,另一些中央银行已经注意增加对商业银行压力测试的监管,还有的正在致力于建立一个定期进行压力测试的系统,并定期公布它们对金融部门稳定性的分析(即所谓的金融稳定性报告)。

五、金融稳定性风险压力测试的未来发展

我们正处于一个不断发生重大变革的年代,快速发展的金融创新和国际一体化趋势一日千里,对处于各种压力之下的金融体系行为产生了深远的影响。金融网络的全球化在降低潜在金融危机发生频率的同时,也增强了危机发生时的破坏强度。近30年以来发生的一系列金融危机,使全球主要金融机构将改善金融稳定性分析作为自己优先考虑的事项安排,最近几年,“自下而上”或公司级的压力测试实践获得了迅速发展;与此同时,各国政策当局也将支持和维护金融稳定作为公共政策目标,并发展了一系列“自上而下”的宏观压力测试模型和系统。政策当局试图通过宏观经济和金融模型估计不利冲击对金融体系的影响。然而金融体系的行为很难被模拟出来,尤其是在参与者和溢出风险、传染风险的策略互动显现出来的压力条件下。虽然面临的压力时期是罕见的,历史也只能给我们有限的帮助,但是我们为了维护金融体系的稳定,必须对未来压力情形发生时金融体系是否稳健进行了解,以便防患于未然。未来理想的压力测试将围绕这三个目标进行:评估金融体系在可信的极端条件下面临冲击的脆弱性;了解金融体系面临冲击时相互间的风险传染效应,对行为反应、相互作用和反馈效应进行整合,以确保获得对全系统的影响;发现金融体系面临冲击时的“薄弱环节”,提前做好危机管理,降低系统风险。为了有效地实现这些目标,在风险价值理论的基础上,构建一种严格、连贯一致和健全的压力测试框架对金融稳定性进行分析将是未来压力测试模型系统的发展方向。虽然政策当局和金融机构在未来实现这一框架系统会面临很多困难和挑战,但这是值得的。这种考虑了宏观调控、金融体系的相互作用和反馈效应的压力测试框架将提高我们对风险和风险价格的理解,更加密切关注所包含的系统性风险和系统性金融稳定,更有针对性的是实施公共政策,进而更好地维护整个社会利益。

参考文献:

[1] P.Jorion.Value at Risk:The New Benchmark for Measuring Financial Risk[M].McGraw-Hill,New York,2001

[2] Cihak, M.How do Central Banks Write on Financial Stability[R].IMF Working Paper,2006

[3] Mark Swinburne.The IMFs Experience with Macro Stress-testing[R].Conference Report on Stress-testing and Financial Crisis Simulation Exercises,Frankfurt, 2007,(12-13)

[4] Dale F. Gray, Robert C. Merton,Zvi Bodie.New Framework for Measuring and Managing Macrofinancial Risk and Financial Stability[R].IMF Working Paper,no. 09015,2008

[5] Andrew Haldane,Simon Hall Silvia Pezzini.A New Approach to Assessing Risks to Financial Stability[R].Bank of England Financial Stability Paper,No.2,2007

[6] C.A.E. Goodhart.A Traverse from the Micro to the Macro Stress Testing[R].Conference Report on Stress-testing and Financial Crisis Simulation Exercises,Frankfurt,2007,(12-13)