博弈分析方法

时间：2023-08-16 17:29:11

开篇：写作不仅是一种记录，更是一种创造，它让我们能够捕捉那些稍纵即逝的灵感，将它们永久地定格在纸上。下面是小编精心整理的12篇博弈分析方法，希望这些内容能成为您创作过程中的良师益友，陪伴您不断探索和进步。

博弈分析方法

第1篇

关键词：经济博弈论语义分析经济学方法论实证分析语言转向

“囚徒博弈”、“智猪博弈”、“懦夫博弈”、“协调博弈”等许多经典案例，被广泛运用于经济学、决策论、管理学等各学科领域；而这些虚构的案例能否用来说明博弈理论引发了学者们激烈的争论。直至今日争论看似逐渐平息，经典案例仍在使用，但争论其实仍是无果而终或只是暂时表面的平静，而相类似的讨论不断在经济科学的其他领域重演。必须认识到，这场争论归根到底是方法论问题。按照传统方法论提出的规范与实证二分法无法处理这一问题，本文试图从语义学的视角进行分析。

争论双方的观点

（一）质疑者的观点

较为温和的批评者认为，“囚徒博弈”等所谓的“案例”不真实，只是一个故事或寓言，不在现实中发生。激进的批评者指出，不仅上述案例是虚构的，经济博弈论中一些所谓真实的案例，也包含有假设和抽象的成分。极端反对者不仅把焦点放在质疑案例本身，而且通过分析案例与模型、现实与理论的关系，进一步对博弈论的整体研究方法提出质疑。

从理论角度看，博弈理论和模型中包含有假设的变量，这些变量无法在现实中进行观察。从案例角度看，在案例中被忽略掉的变量对结论不一定是无关紧要的，相反可能是必要的甚至是决定性的。因此整个博弈论漠视了变量可观察的重要性，无论理论建构还是案例实证都需要做出改进。

（二）支持者的观点

对案例使用的辩护者则直接从研究方法出发，首先强调博弈论研究中使用假设和抽象是不可避免的。任何一门科学研究都需要假设和抽象，抽象和假设并不是博弈论的局限性，而是任何理论的局限性。经济学科的研究方法如同物理学、生命科学的研究方法一样，通过抽象和假设从万千变化、纷繁复杂的社会经济现象中找寻本质的经济规律，经济学家使用博弈模型的目的是试图完成一种可解释不同经济现象的一般理论或机制体系的建构，通过博弈模型抓住诸多现象的本质机理。

（三）观点比较及本文的思路

通过以上双方观点分析可以总结出双方的三点同识和一点分歧，如表1所示。同识在于：第一，双方都同意博弈论属于实证分析而不是规范分析；第二，无论反对者还是支持者都认同博弈理论的正确性需要在现实中得到验实；第三，真实的案例有证实或证伪博弈理论的作用。而分歧主要在于：虚构的案例能不能用以论证博弈理论？支持者表示同意，反对者坚决抵制。

传统的经济学规范和实证的二分法并不能处理关于博弈论案例使用的争端。而如果将博弈论作为一类知识，从知识论的角度对实证知识的语义进行分析，则实证知识可进一步划分为综合知识和分析知识，它们都属于实证知识的范畴，但有着不同的命题性质。本文旨在介绍实证知识二分法，阐明分析命题与综合命题的命题性质与逻辑关系，论证经济博弈论属于分析命题的范畴，划清了博弈论案例使用的合法范围，以避免研究中的方法误用。

经济学实证知识的二分法

（一）经济学实证与规范二分法

经济学以实证方法描述经济事实、发现经济规律。实证与规范二分法最早追溯到休谟（D.Hume），休谟砍刀（Hume`s guillotine）提出不能从是中推出应当，经济学实然知识与应然知识是截然不同的，需要分别采取各自不同的方法进行研究。穆勒（J.S.Mill）、韦伯（M.Weber）、西尼尔（N.W.Senior）和凯恩斯（J.N.Keynes）的著作对这个划分进行了进一步的阐述与运用。弗里德曼（M.Friedman）著名的论文“实证经济学方法论”中再次提出，并且对它进行了详细地讨论，“斯诺命题”加深了人们对两类知识差异的认识。当前关于实证分析和规范分析的二分法，在经济学领域是被普遍接受的。

（二）经济学实证知识二分法的提出

将经济学知识视为整体知识体系中的一类，则按照研究方法将经济学实证知识划分为分析知识和综合知识。在第一个层次，经济学理论作为一门学科是通过命题语言来表达，命题语言既包括文字语言，也包括符号语言、数学模型或公式。在第二个层次上，按照传统划分，经济学分析划分为实证分析和规范分析。在第三个层次上，经济学实证命题可划分为分析命题和综合命题，同时根据实证原则将命题划分为无意义的实证命题和有意义的实证命题。

经济博弈论实证知识类型证明

（一）从主词指称上

从语义学上看，命题的主词是概念词或是专名。概念词表述某类事物或属性，专名表述个体事物。弗雷格对命题主词的涵义与意谓做出明确划分，指出在数学中，a=a和a=b之间的差别，只是表达形式上的差别。前者使用相同的符号，后者使用不同的符号。由于它们表示相等的数量关系，所以可以用a代替b，或者用b代替a，等式仍然成立。但是在命题语言中情况就不同了。在命题中要考虑语义的关系，即同时要考察主词的意义与意谓，这不像代数的等式中那样只考虑数量间的相等关系。

主词的意义是主词表述的思想，主词的意谓是主词指称的对象。“苹果”是有意义且有意谓的概念，“理性”是有意义但无意谓的概念，“地球”是有意义且有意谓的专名，“智猪”是有意义但无意谓的专名。对于任何一个有意义的命题，主词必然有意义，但不一定都有意谓。有意义的命题，主词一定有意义，但不一定有意谓。综合命题的主词必须同时有意义与意谓，即在实现中的相对应的对象。

根据命题主词指称分析，经济博弈论属于分析命题。从博弈理论看，理论的真与主词的意谓无关；从案例看，如“智猪博弈”中用任何一个概念代入x或y，或替换“大猪”和“小猪”，案例结论仍成立。

（二）从命题与现象的时空关系上

在命题与现象的时空关系上，又体现了分析命题与综合命题的根据不同。引用张庆熊等学者说明赖尔（G.Ryle）“范畴错误”所使用的五个命题：“（1）一只苹果正挂在树上。（2）苹果服从万有引力定律。（3）我剪断了它的柄。（4）苹果因为万有引力掉到地上。（5）苹果掉到地上因为它的柄被剪断了”。

分析命题具有超时空性，分析命题的真包含一切可能的世界，求证分析命题的真与时空无关。时空是综合命题真的必要条件，综合命题描述的对象一定位于现实世界。时间、空间是综合命题必然的、普遍有效的形式，是因为综合知识如果是可以理解的话，或者说如果是综合命题的话，就必定带上时间、空间和因果性的印记。空间、时间和因果性是综合命题的可能性的条件。

于是，句（1）、（3）与句（2）在逻辑上是不同范畴的实证命题。句（1）和（3）属于综合命题，它们报道发生的事情，人们可以提问句（3）在什么地方剪断苹果柄，它在什么时候发生，它花了多少时间等。句（2）不是综合命题而是分析命题。句（2）是理论或假设而不是一个事件，它并不发生，它假设命题在一切可能世界都为真。对这样的句子不能提问在什么时候、在什么地点发生了什么事情，它是理论或假设。根据命题与现象的时空关系分析，经济博弈论属于分析命题。从博弈理论看，命题的真与时空无关；从案例看，案例的发生与时空无关。

（三）从命题间的因果关系上

从命题间的逻辑关系上分析，用分析命题作为原因的命题仍是分析命题，用综合命题作为原因的命题是综合命题。句（4）和（5）都在解释苹果掉到地上的原因，都属于实证分析范畴。用句（4）作为苹果落地的原因，再用句（2）作为句（4）的原因，是采用逻辑演绎方法进行推理，因此句（4）是分析命题。用句（5）作为苹果落地的原因，再用句（3）作为（5）的原因，是通过经验观察获得的知识，因此句（5）是综合命题。尽管句（4）和句（5）中都有“因为”这两个字，都属于实证分析的范畴，但是这两个“因为”在各自的句子中所起的逻辑上的作用是不同的。但前者是分析知识，后者是综合知识，不能犯“范畴错误”。

与此相联系，分析知识的真是必然的，综合知识的真是偶然的。用句（2）作为句（4）的原因是必须的，它的反面是不可能；用句（3）作为句（5）的原因是偶然的，它的反面是可能的，即苹果有“我剪断了它的柄”之外的原因落地。分析命题的真假通过逻辑规则推论出来，综合命题是建立在经验事实的基础上，其真假通过经验加以检验。

根据命题间的因果关系分析，经济博弈论属于分析命题。从博弈理论看，命题间的因果关系是必然的；从案例看，案例的结论与前提的关系是必然的。

（四）从命题的验证方法上

从命题的验证方法上分析，分析命题通过逻辑规则，综合命题通过实际观察。分析命题依据矛盾律从一些先天的概念、原则演绎出来；综合命题通过归纳一类事物的性质或事物间的关系得到结论。验证分析命题，只要看看它们是否在逻辑上自相矛盾；验证综合命题，则要看看它们是否与现实中情况相符合。

对此托马斯·谢林（T.C.Schelling）也指出，博弈论是抽象的和推论的，而不是一门研究人们如何决策的经验主义科学，但它是一种附有以下相关条件下的演绎原理，即参与者的决策必须是“理性的”、“一致的”或“非矛盾的”。

根据命题的验证方法分析，经济博弈论属于分析命题。从博弈理论看，它不能被综合命题证明或证伪，因为它的检验不依赖于经验事实而依赖于逻辑规则。从案例看，无法被经验观察所证明或证伪，因为它的检验来源于理论模型内部的正确性。

通过综合命题和分析命题的五个性质区分（见表1），本文证明了博弈论及其所使用的案例均属于分析命题的实证知识范畴。

结论及启示

（一）结论

经济博弈论属于分析知识。根据传统方法论分析，经济博弈论属于实证知识而不是规范知识，是关于“真”的知识。而根据语义分析，在知识类型上经济博弈论属于分析知识而不是综合知识。如图1所示，分别用实线框和虚线框表示属于和不属于经济博弈论的语言区域。在求真方法上，经济博弈论通过演绎、推理获得，而不是通过经验观察从现象中获得。

不仅是虚构的案例，任何案例运用于博弈理论研究中，既无效又无益。本文业已证明博弈论知识属于分析命题范畴，博弈论的真与案例无关，试图用空想的案例或抽象的案例来“实证”博弈理论的做法是无效。用案例去论证博弈理论，是用综合知识的研究方法去处理分析知识，是对博弈论研究方法的破坏，对整个博弈论研究是无益的。

博弈论案例使用争论双方的观点都是对的。反对者绝不允许用虚构的案例去论证实证知识的做法是正确的，是对实证精神和实证方法的捍卫。支持者绝不允许实证知识只停留在抽象思维的层面，坚持用案例证实或证伪理论的做法是正确的。产生争论的真正原因是误把作为分析知识的博弈论当作综合知识。如表2所示，争论双方的观点都是对的。

第2篇

【关键词】游戏教学法博弈论

项目支持：陕西省教育科学“十二五”规划项目：双语教学“多位一体化”教学方法研究（SGH140755）。

引言

博弈论是研究策略性决策行为的社会经济科学分支，提供一种思维方法，帮助在互动行为中的行为方提高发现和引用有效策略的技能[1]。博弈的思想起源于游戏，数学家冯・诺伊曼运用数学模式研究游戏者应该如何在游戏中选择自己的策略，奠定了现代博弈论的基础[2]。由于博弈论和经济学的基本假定相同，强调个人理性，所以博弈论在经济学中获得了最广泛、最成功的应用，博弈论已成为经济分析最合适的工具之一。目前，博弈论课程作为相关本科专业的选修课，开设时间尚不长。授课方式以教师讲授理论为主，不利于激发学生的独立思考。加之博弈论的研究过程和分析方法一定程度上依赖于数学工具，需要一定的数学基础，学生在学习时觉得抽象有难度，课堂教学普遍沉闷、乏味[3]。因此，博弈论的课堂教学方法急需创新和改革。

游戏教学法

游戏教学法是游戏和教学的结合体。游戏是在某一固定的时空范围内进行的一种自愿的活动，其规则是游戏者自愿接受的，但又有绝对的约束力[4]。就游戏的内在精神而言，教学可以成为游戏。

最早对游戏法进行系统阐述的是德国哲学家康德。1952年教育和发展心理学大师皮亚杰将游戏理论延伸到教育学领域。1976年日本索尼公司在学员培训中创立管理游戏。此后许多世界知名大学相继将管理游戏引入课程教学[5]-[6]。1996年北京科技大学率先引入管理游戏，国内一些学者从理论角度探讨游戏教学法的可操作性[7]-[8]；另一些学者从实践角度，将游戏教学法应用到历史、体育、管理学等诸多课程中[9]-[10]。然而，却鲜见在博弈论课程教学中引入游戏教学法。

博弈起源于游戏，无论是其英文原名（Games）还是中文翻译（博和弈是中国古代的象棋和围棋），都体现了与游戏的关系。博弈论课程主要分析互动行为，论文提出在课堂教学中引入互动性很强的游戏教学方法，并实施一个具体的课堂游戏，让学生充分参与到游戏和学习活动中，期望这种新的教学方法对博弈论的课程教学有所裨益。

“选字母”游戏的设计实施

游戏互动教学法主要用在课堂引入或重难点讲解过程中，设计一些让学生参与其中的实验性游戏，在游戏中独立思考，组织策略，得到游戏结果，进而讨论、反思，学习理解理论知识。

1.游戏设计。博弈的组成要素，是理解和分析博弈过程的基石。在博弈论的首次课程中，作为课程引入，设计“选字母”游戏，引入介绍博弈基本要素、静态博弈的得益矩阵等知识。通过游戏激发学生对该课程的兴趣，加深对博弈组成要素知识点的理解。

2.游戏参与。给定游戏规则：学生互不商议参与游戏，字母a、b二选一。之后将随机把学生分为两人一组，根据得分判断胜负：同选字母a各得2分，同选字母b各得3分，不同选择时选a得5分，选b得1分；两人中得分高者胜。给学生充分的时间理解规则，同时在纸上写出自己所选择的字母。

学生独立思考选择后，随机挑选两位同学为一组判断胜负。为增加参与性和趣味性，可随机多选择几组同学，判定胜负。

3.游戏讨论小结。游戏暂时告一段落，请几位同学阐述自己选择的理由，进而分析游戏，讲解知识点。

首先，引导学生分析游戏构成，借以学习博弈的基本要素。完成游戏需要有参与游戏的人和游戏规则。游戏参与者在博弈中称为“博弈方”。游戏规则是所有参与者都了解的内容，在博弈中称为“信息”。游戏规则 “字母a、b二选一”，规定了参与者在游戏中可以选择的行为，在博弈中称为“策略”；游戏要求所有人同时作出选择，即规定了游戏的参与顺序，在博弈中称为“次序”；得分标准即个人在游戏中所得的结果，在博弈中称为“收益”。进而具体讲解博弈的基本构成要素：博弈方、策略、信息、次序、收益。

其次，在这个简单的博弈游戏中，个人的收益依赖于自己和对手的选择。引领学生用表格的形式表现游戏结果，下图1为自己的收益，图2为对手的收益：

观察发现两个表格基本一致，为表现更简便，引导学生将表格合二为一，用数组方式表示收益：第一个数字表示左侧博弈方收益，第二个数字表示上侧博弈方收益，如下图3。图3所示的表格即是博弈的基本表达形式“得益矩阵”。

至此，通过“选字母”游戏，在轻松的学习氛围中，学生已经基本掌握了博弈的基本要素及得益矩阵的表达方式。过程简洁易懂，可让学生通过自己总结完成，以达到这节课游戏教学的教学目的。

最后，还可以提出思考问题：在考虑他人的策略下，如何选择，可以使得自己的得益最大？如果游戏允许两人商议，又应该如何选择？通过开放问题的设置，引发学生思索讨论，为后续个体理性、集体理性、博弈求解等知识点作好铺垫。

游戏教学法实施过程及原则

1.根据教学内容，选择并设计合适的游戏。游戏教学中，课前游戏设计是关键，主体是教师，应在对课程内容充分理解和全盘把握的基础上，确定游戏教学实施的章节和知识点，进而设计游戏。课堂游戏的设计，一方面要与知识点相关联，另一方面要有一定的趣味性和群体参与性。游戏是一种辅助教学手段，课前应准备相应的游戏道具，细化游戏规则。原则上游戏应简单易行，灵活可调整，易于实施，结果便于分析。同时，应充分考虑到游戏过程中可能出现的各种情况，做好准备方案。

2.课堂游戏引入。教师要在合适的时机介入和结束游戏，避免学生只关注游戏而忽略知识点。根据知识特点和游戏规则，合理组织学生，分小组或个人参与游戏。游戏进行之前，教师介绍游戏的基本内容，阐明游戏的基本规则，可执行的基本行为。结合实际情况，帮助学生理解和分析游戏中隐藏的信息和行为方的可选策略，对一些较有难度的策略，给予提示和简要分析。

3.游戏体验。游戏参与实施环节主体是学生，在理解规则的基础上，独立思考，独立决策，理性分析，给出自己的游戏方案。游戏过程中，教师暂时不再是知识的传授者，而是游戏的主持人或参与者，要营造宽松、自由的环境，让学生充分发挥主动性参与其中，体会游戏带来的乐趣。

4.游戏结果分析讨论。博弈研究的是相互影响的决策行为，其结果依赖于博弈方的不同选择。因此游戏的结果，由于参与者的不同行为而呈现多样性。教师应引导学生一起思考其他人的行为策略，讨论各自的行为对游戏结果带来的影响。必要时还可将游戏进行多轮，在其中体会不同策略组合下的不同游戏结果，讨论导致不同游戏结果的原因及博弈结果的影响因素。

5.游戏总结评析。对游戏结果的分析讨论和反思，是课堂教学组织的重点。有些学生可能只享受了游戏的乐趣，却没有思考其中的知识。教师借助游戏讲解相应的知识点，结合游戏的组织完成过程，充分理解其中包含的博弈基本思维方式和分析方法，利用游戏帮助学生理解理论。通过这些游戏性的实验，提高学生的兴趣，然后针对不同实验结果，教师逐步切入主题并解释分析。有老师深入浅出的讲解，再加上亲身体验，学生对知识的理解将更深刻。

进一步，还可以让学生尝试用所学的知识分析游戏，思考如何在游戏中更理性地给出行为策略，以获得最好的结果。引导学生理解理论体系和博弈的思维方式，体会合作意识对博弈结果的重要影响。

结论

博弈论是一门理论及应用性均较强的课程。论文尝试在课程中引入游戏教学法，打破传统单一的教学模式，以游戏为桥梁，让学生充分参与到学习活动中，促使学生主动学习，培养学生独立分析问题情境、独立探索思考策略的习惯和能力，同时在模拟游戏分析的过程中，感受理性与合作的重要意义及实施过程，自发在学习生活中运用博弈的思维模式，形成一种新的思维和行为方式。游戏教学法作为一种新的教学方法，在其组织过程中，对课堂的掌控还有待于在实践中进一步探索和完善。

参考文献：

[1]张维迎：《博弈与社会》，北京大学出版社。

[2]尉洪池：《博弈论和语言游戏》，《外交评论》2013年第1期，第126-138页。

[3]李太龙：《博弈论公选课的教学内容与方法探析》，《教育探索》2012年第1期，第42-44页。

[4]周建平：《游戏教学观论要》，《教育理论与实践》2002年第22期，第56-59页。

[5]Pearson P， Webb P. “Improving the quality of games teaching to promote physical activity”. Journal of Science and Medicine in Sport. 2006，9（1）：11.

[6]Demirbilek M， Tamer S L. “Math teachers’ perspectives on using educational computer games in math education”. Procedia-Social and Behavioral Sciences. 2010（9）：709-716.

[7]蒋璐：《游戏教学中的个性化与社会化的统一》，《中国教育信息化》2010年第8期，第16-18页。

[8]张臻、张世波：《从熵的角度反思游戏教学》，《教育理论与实践》2011年第31期，第51-53页。

[9]侯雁飞：《美国数字游戏教学模式对我国历史教学改革的启示》，《教育科学》 2013年第29期，第82-85页。

第3篇

博弈论又称为“对策论”，一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象，因此很多领域都能应用博弈论，例如军事领域、经济领域、政治外交，解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。

博弈论的研究开始于本世纪，1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成，随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖，使博弈论在经济领域中的地位和作用得到权威性的肯定。

2．博弈论的基本原理和方法

文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来，博弈论模型可以用五个方面来描述

G={P， A， S， I， U}

P：为局中人，博弈的参与者，也称为“博弈方”，局中人是能够独立决策，独立承担责任的个人或组织，局中人以最终实现自身利益最大化为目标。

A：为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限，可分为有限博弈和无限博弈，后者表现为连续对策，重复博弈和微分对策等。

S：博弈的进程，也是博弈进行的次序。局中人同时行动的一次性决策的博弈，成为静态博弈，如齐威王和田忌赛马；局中人行动有先后次序，称为动态博弈，如下棋。

I：博弈信息，能够影响最后博弈结局的所有局中人的情报，如效用函数，响应函数，策略空间等。打仗强调“知己知彼，百战不殆”，可见信息在博弈中占重要的地位，博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息，如果博弈各方对各种局势下所有局中人的得益状况完全清楚，称之为完全信息博弈（game with complete information），例如齐威王和田忌赛马，各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈（game with incomplete information），例如投标拍卖，博弈各方均不清楚对方的估价。在动态博弈中还有一类信息：轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈（game with perfect information），例如下棋，双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”（game with imperfect information）。由于信息不完美，博弈的结果只能是概率期望，而不能象完美信息博弈那样有确定的结果。

U：为局中人获得利益，也是博弈各方追求的最终目标。根据各方得益的不同情况，分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系，争取双赢的局面。

还有另一类型博弈称为多人合作博弈，例如安理会投票表决，OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上，它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域，特征函数表示各个联盟的得益（N是局中人的数目），它的分配解必须符合一定的合理性和稳定性，它的解的概念也发展成多种多样，包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要，针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。

不管博弈各方是合作、竞争、威胁还是暂时让步，博弈论模型的求解目标就是使自身最终的利益最大化，这种解建立在对方也采取各自“最好策略”为前提，各方最终达到一个力量均衡，也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。

3、博弈论与电力市场

博弈论是研究市场经济的重要工具。电力作为特殊的商品，它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中，遇到很多前所未有的新课题，运用博弈论来分析解决其中一些问题是一个研究方向。用博弈论模拟电力市场，模拟的结果可能更加接近实际，为市场模式设计提供依据。另外，电厂或用电用户作为市场的参与者，可以用博弈论来分析市场，研究如何报价获利最大。

正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如：力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法；而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题：如何识别合作伙伴，结盟利益如何在联盟内分配。电力市场环境下，电网输电作为一项服务，它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解：稳定集，核心，核仁，Shapely值等，如何合理选择或创造最接近实际的解的概念也是面临的课题。

博弈的结果是依赖于拥有的信息，采用什么样的信息披露政策是设计电力市场模式的一个方面。例如：电厂竞价上网，一个成功的报价不仅取决于自己的实力，还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息，因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来，博弈的实验结果也为电力市场披露怎样的信息提供依据。

博弈论和电力市场理论都是很年轻的科学，两者都有广阔的发展天地，两者的结合可以互相促进。

4、博弈论在电力市场中的应用

4.1自备电厂与公用电网之间的交易

开放发电市场的进程中，拥有自备电厂的用户是一类特殊的市场参与者，它既是用电用户，也可以是电力的供应者。随着电力市场深入发展和工业的进步，自备电厂将成长为一支生力军。

文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户（NCP）对定价的影响作用。NCP既可以从公用电网购电，也可以自己发电来满足自身需求。为解决两者的冲突，作者提出了三种博弈模型：非合作Nash博弈模型，合作博弈模型和超博弈模型。作者构造了三个局中人：公用电网，普通用户，带自备电厂的用户（NCP），并且假设它们的需求函数、边际成本、收益函数等均是线性的，通过数字模拟得出了一些有趣的结果：①NCP的加入促使公用电网降低出售给NCP的电价；②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进：①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况；②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场，如果公用电网规模很大，NCP数目很多但规模小，考虑Stackerlberg模型更符合两者实际；③该文假设公用电网的目标函数是整个社会利益最大化，而并非是自身利益最大化，这个假设不符合电力市场需要解除管制的发展方向。

文献[ 6]部分解决了以上问题，它重点放在自备电厂和公用电网相互作用的方式的选择：公用电网回购NCP多余电力（buy-back system）或者公用电网收取NCP运转电力的过网费（wheeling charges）。该文分析了在不同市场环境下，各方的得益情况，得出了一些可能只有用博弈论才能得出的结论。

4.2区域间输电交易分析

互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析，得出双方都可接受的交换功率和交易价格。在此基础上，文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策，采取合作型对策，应用 Nash谈判公理作为仲裁程序，决策出双方都可接受的交换功率和交易价格。应该指出，白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息，又应该如何分析处理呢？这个问题值得进一步深入探究。

4.3转运市场中电网的固定成本分摊问题

运转市场中一个难题是网络输电服务定价，这个定价能够给网络使用者一个信号，以达到全网最优化；并且能够补偿网络的投资者，网损、变动成本、固定成本等费用在网络使用者中合理分摊；同时能够正确激励网络增容。节点实时价格（nodal spot price）制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资，为了解决双边贸易中输电系统固定成本公正分摊问题，作者提出了基于多人合作博弈模型，可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点：①使用“核仁”而不用Shapely值，因为“核仁”处于核心，分配值更加稳定和易于被各方接受；②提供了一种激励，减轻线路过载。

4.4 基于Pool或PX模式的多边贸易市场

电力市场环境下的博弈具有行动策略随机性、信息隐蔽性，这些特点都给建模和计算造成困难，从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中，通常需要假设或者估计对方的信息，方法各有特色。

在文献[10]作者认为在完全竞争的市场环境下，市场参与者相对于市场规模都显得很小，市场影响力很小。在这种情况下，优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场，单个市场参与者对市场是有影响力的，其模型本质上属于不完全信息的非合作博弈。例如：每个参与者只知道自己的成本信息，而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题：在无法完全了解对方的信息情况下，参与者如何投标（选择高价投标还是低价投标）才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类，并对每一类的可能性进行概率估计，形成一个概率意义上的期望收益矩阵，用Nash平衡点的概念求解矩阵，得到问题的解。

文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时，都同时执行以下两个步骤：①对可能的合作对象按照一定的指标进行优先排序；②按照谈判优先顺序，逐一进行讨价还价，谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类，并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作，互相交换共享所拥有的信息，联合成博弈的一方，剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值，作为与B合作的优先指标。对每个局中人都进行一遍以上计算，得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序，各方同时进行合作谈判，谈判要解决如何合理分配或均衡比单干多出的利益。

该文关键的一点：正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息，并用这种反馈来更新自己的知识库，提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点：计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。

对于多边贸易模式的电力市场，文献[13]提出了多理论模型，解决贸易合作问题，文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段：①确定自身成本等信息；②与对方互相交换信息，互相寻求合作伙伴；③按照预先设定的准则和协议进行联合分组，形成一个谈判对象优先顺序表，这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表；④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行，直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况，但是模型仍偏于简单。

4.5用博弈论解释和实现算法

文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下，竞争各方均以实现自身利益最大化为目标，旋转备用的约束变得软起来，PX（power exchange）机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。

作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的，松弛旋转备用的乘子被看作是提供备用的价格信息，各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整（例如：为t时段负荷）。根据优化原理，如果拉格朗日函数存在鞍点，则鞍点是原问题的最优解。

鞍点的概念与博弈论中的Nash平衡点有非常相似之处，如以上公式所示。基于此想法，作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益，它控制的决策变量是p，u（p向量表示各机组分配的有功，u向量表示机组启停），目标是使整个系统成本最低。另一个局中人Q，是一个假想的发电商，它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价，最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论，作者设计了自适应的次梯度算法寻求平衡点，其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数该函数将映射到备用容量的两种水平之间（例如：5%Dt-%Dt，Dtt时段负荷），形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数，模型可细分为两种：Nash模型（不了解对方反应函数）和Stackelberg模型（Q了解P的反应函数），作者认为后一种模型掌握的信息较多，因此收敛的速度和优化的效果梢好于前一种模型。

用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学，不过它更具有人的逻辑思维的色彩，融合了一些用别的方法难以表达的信息。

第4篇

[关键词]木马检测策略动态博弈

中图分类号：TM925.07 文献标识码：A 文章编号：1009-914X（2015）05-0282-01

1 引言

近年来，随着网络应用复杂度的不断提高，网络攻击方法层出不穷。各种网络攻击方法中，木马攻击是最具危险的手段之一。一旦计算机系统被种植木马，就将长期潜伏，对系统的保密性、可用性造成致命伤害。本文提出了一种在新型木马检测系统中，基于不完全信息博弈理论的计算机木马检测策略选择方法，为解决准确检测木马问题提供了新的思路。

2 计算机木马检测系统构成

本文成果应用的计算机木马检测系统由主机信息检测模块、网络信息检测模块和智能决策模块三个模块组成。

主机信息检测模块对主机的文件、进程、网络连接、加载文件等信息结合白名单检测、端口关联等检测方法，按照检测策略进行检测。网络信息检测模块基于网络协议的分析，对宿主主机发出的数据包进行层层剥离，准确获取数据包信息，同时根据各种信息特征进行统计，从中发掘可疑网络流量信息。智能决策模块将网络和主机获取的数据根据攻击特征进行逐项分析，然后对分项结果关联形成检测结论，最终显示给用户。

3 木马检测与反检测博弈行为分析

3.1 木马反检测的一般方法及分析

木马必须的功能包括隐蔽启动、网络外联。木马反检测方法大体有隐藏进程、隐藏模块、隐藏网络连接、隐藏文件、隐藏服务、隐藏启动项、穿透防火墙。

3.2 木马检测的博弃行为

在木马检测过程中，自始至终存在着对抗双方检测与反检测的博弈。木马检测系统要制定应对不同等级木马的检测策略。从检测到的可疑程序中将这些正常程序甄别出是系统的重要工作。在计算机被种植木马的环境下，检测工作是一个双方不完全信息动态博弈的过程，检测系统必须逐步寻找最优策略，以达到检出目的。

3.3 不完全信息动态博弃

根据随机博弈的思想，检测系统的每一个部分检测的结果概括成一种“状态”。双方在该部分的收益取决于各自采用的策略。通常，一个两方随机博弈用如下七元组描述（S，，， Q，，，β），其中：

一般的木马检测博弈过程如下：在某个检测模块工作的时刻t，博弈处于状态∈S。，木马从反检测策略集中选择策略，，系统从检测策略集中选择策略，然后木马得到一个收益= （，，），系统得到收益= （，，），然后博弈进入第二个状态∈S。

根据不完全信息动态博弈理论，当期收益不仅取决于当前状态和这种状态下木马与检测系统选择的策略，还取决于双方针对对方类型所做的概率分布判断。根据随机博弈理论，木马的收益应该为= （，，），假设此时木马对不会被检测出的概率判断为μ，根据不完全信息博弈理论，其收益为= （，，，μ），同理，假设此时检测系统对木马是否判断出被检测出的概率判断为λ，此状态下其收益为= （，，，λ）。

4 基于动态博弈的木马检测策略选择

木马检测环境下，针对一个特定的状态，策略选择过程为：

（1）首先确定检测系统和木马的策略集；

（2）当前状态下，确定针对检测系统不同的策略，木马对被检出的概率μ分布；

（3）根据木马实现技术水平的高低确定木马类型，然后检测系统确定木马类型的概率分布ν，在此基础上根据木马在当前状态下采取不同的策略下，确定木马判断出被检出的概率分布λ；

（4）确定木马的收益函数。为了长时间牢固控制主机（I），木马需具备反检测手段（T），由此确定木马的线性收益函数为：=（I-T）（1-μ）（1）

（5）确定检测系统的收益函数。检测系统的收益函数与木马反检测水平（T），检测系统获取的信息（），木马判断检测系统会采取的检测方式信息（）相关，由此确定检测系统的线性收益函数为：=（γI-T-）（1-γ）（2）

假设检测系统对木马类型的判断概率是，则对n类木马，系统在该状态下的收益为：

（6）计算纳什均衡解，确定木马检测策略。要达到纳什均衡解必须满足两个条件：检测系统采取的策略要实现自己的收益最大化；要使木马的收益尽可能高。

成立的策略'为其最优策略，其中表示确定检测系统所有策略下的最大收益，'为选择该策略下的木马的判断概率。

对检测系统而言，使得条件：

成立的策略'为其最优策略，其中'表示系统在木马自防护策略下的最大收益，'为选择该策略下的系统的检出判断概率。

5 示例与仿真

以主机信息检测部分为例，使用简化策略进行仿真分析。

（1）确定双方策略集

在主机信息检测状态下，检测系统的策略集。

（2）确定木马对检测系统策略类型评估的概率μ分布

根据木马反检测能力的高低分为三类，高级木马，中级木马，和初级木马，根据经验，木马对检测系统策略评估正确的概率μ分布如表1。

（4）确定木马在当前状态下的收益

根据经验确定控制主机I值，反检测T值表。

（6）计算纳什均衡解

木马的最优策略是；根据式（3）及表3，检测系统的最优策略是。

6 结论

木马检测策略是木马检测系统的关键之一。本文提出了一种基于不完全信息动态博弈的木马检测策略选择的方法，该方法基于对抗的动态性及对抗双方信息不完全的特点，把信息获取和不完全信息动态博弈有机结合，示例与仿真初步验证了模型的有效性。

参考文献

[1] 闫怀志，胡昌振，谭惠民。网络攻防对抗策略选择模糊矩阵博弈方法。武汉大学学报（理学版），2004，50（S1），103-106.

第5篇

[关键词]演化博弈;政府采购;寻租;监管

[中图分类号]F224.32 [文献标识码]A [文章编号]1005-6432(2010)45-0106-02

1 政府采购的寻租行为

政府采购是相对于个人采购、家庭采购、企业采购或团体采购而言的一种采购管理制度。虽然自《政府采购法》实施以来,我国政府采购不断取得新的进展,但也存在很多问题,比如,政府采购制度建设不够,尤其是监管体制不健全;政府采购的法定监管部门目前还没有把对政府采购的检查纳入日常工作,政府采购活动的整个过程中并未形成全程式的监管。政府采购本是政府利用权力管理社会经济的一种方式,但由于我国经济体制、权利委托人即纳税人的信息不充分、监管部门检查困难等原因,政府采购在实施中难免有权力的寻租。本文研究的寻租是指供应商以合法或非法手段获得租金即非生产性利润的行为。

2 政府采购寻租监管的演化博弈模型构建与稳定性分析

2.1 演化博弈及均衡点稳定性

演化博弈是经济学研究的新方法,经济学家已经运用该方法在社会习惯、规范、制度或体制形成的影响因素以及解释其形成过程方面取得了令人瞩目的成绩。它把博弈分析和动态演化过程分析结合起来,研究了一群有限理性的个体重复进行某个博弈时,系统整体的行动、规则或策略的分布特征。博弈双方收益矩阵复制动态是演化博弈分析的机制之一,以2×2对称博弈为例,博弈双方的收益见表1。

2.2 模型假设及分析

供应商的行为策略有两种:寻租,不寻租;监管部门也有两种行为策略:检查,不检查。当监管部门选择检查时,若发现供应商有寻租行为,就要对其进行惩罚,但是监管部门也要为检查付出一定的成本,包括来自检查缺失造成的上级部门对其的处罚损失,当然这种成本可以通过上级部门的投入和奖励来补偿。供应商和检查部门的博弈的支付矩阵见表2。

参考文献:

[1]穆森.完善我国政府采购制度的路径选择[D].河南大学,2008(5).

[2]李春玲,孔祥利.基于演化博弈论的农民工权益保障研究[J].科学与管理,2009(1).

[3]计国君,张茹秀.基于演化博弈的生态供应链采购管理研究[J].生态经济,2010(1).

第6篇

[关键词] 逃票管理博弈

近年来,随着我国旅游业兴起以及各旅游景点的门票价格大幅度上涨,我国旅游风景名胜管理部门在景点管理方面所存在的弊端日益暴露,由此产生的游客逃票现象日益增多,成为了旅游景点管理的一大难题。从经济管理角度来看,逃票行为不仅严重减少了旅游景点的经济收入,增加了旅游景点的监管成本,而且还扰乱了其正常地经营秩序。景点门票价格过高是国内大部分旅游景点普遍存在的问题。在国外旅游景点制定的门票价格与当地居民平均收入水平相比要低得多。发达国家(美、日、澳等)代表性景点的门票价格与当地居民月平均收入的比例都保持在0.5%～1%左右;同为发展中国家的印度与埃及,其景点门票对本国公民也保持在极低水平线上。而在我国,景点门票价格与当地居民月平均收入的比例少则6%,多则达到25%以上。由于门票价格高于游客所能承受的预期价格,而逃避门票可以获得免费游览景点的收益,门票价格越高,收益越大,所以经常有人甘冒风险。

为了有效控制部分游客的逃票行为,许多旅游景点采取了一系列的管理措施,但其中大多是对游客收取罚金,对抓住逃票游客的守卫给予适当的经济奖励,这种办法对于减少游客逃票行为是否有效果呢?下面我们通过建立博弈模型来进行分析。

一、景点管理者与游客的博弈分析

1.建立博弈模型

该博弈的具体内容如下:有两个参加者,一个是景点的管理者代表(守卫),一个是游客;游客可以按不同的概率分布选择逃票或买票,管理者守卫可以按不同的概率分布选择偷懒和尽责;游客和守卫决策的时间是一致的,没有先后之分。对于双方的每一组可能的决策,双方的利益都是可以量化的。

该博弈还应遵循以下基本假设:(1)守卫和游客都是理性的,以追求自身利益最大化为目标;(2)博弈规则是既定的、透明的、公开的,博弈双方的策略及在相应策略下的收益是公开信息,即双方行为选择属于完全信息静态博弈;(3)只要守卫尽责游客逃票就会被发现,守卫不尽责游客逃票就会成功。

博弈内容确定之后,可以写出他们的支付矩阵(图):

其中,V表示游客逃票没有被抓到而获得的收益,其相当于门票价格;-P表示游客逃票被抓到并受到多于门票价格的罚款,效用为负;-D:表示守卫没有尽责监督,被发现则给予处罚;F表示如果守卫尽责抓住逃票者则给予相应奖励;S表示守卫偷懒而游客买票,守卫获得正效用;Pa表示游客会以此概率逃票;Pb表示游客会以此概率买票;Pe表示守卫会以此概率偷懒;Pd表示守卫会以此概率尽责。

矩阵中每个元素都是由两个数字组成的数组,表示在博弈双方所选择策略组合下双方各自的得益。其中第一个数字表示游客的得益,第二个数字表示守卫的得益。

现在我们来求解这个博弈的纳什均衡,即博弈双方经过博弈之后游客会以多大的概率逃票,而守卫会以多大的概率尽责。过程如下:如果概率给定,

则守卫偷懒的期望收益应该为:(1)

守卫尽责的期望收益为: (2)

要想得到纳什均衡,则守卫偷懒和尽责所得到的收益一定相等,否则守卫就会改变现有的策略而追求更高的收益。

故有,即(3)

解得(4)

同理可以使游客逃票与不逃票的收益相等,有(5)

由这个等式可以看出,如果想将游客买票的概率Pb增大,可行的办法是增大F和D的部分,而增加P只能导致守卫偷懒的概率Pe增大。

由以上分析得知:采用游客罚款和奖励守卫的方法,对于游客逃票的行为的控制并不能达到最好的效果。采取这种方法短期内可能使游客逃票现象减少,但是长期的采取这种方法会导致守卫偷懒,游客逃票几率反而增加。旅游景点的管理部门应加大对没有尽职的守卫惩罚力度,采取对守卫奖罚相结合的措施来抑制日益增多的逃票行为。

根据以上的博弈模型,我们得出了景点管理的一些有效的方法,下面我们探讨其他具体的治理方法。

二、逃票现象治理方法的探讨

1.风景名胜区门票价格的制定方法探讨

门票价格过高是游客逃避购票的一个重要原因。管理当局应当用各种方法制定合理的门票价格。如对内有多景区的景点可以采取套票和联票结合的形式:即先收取总门票,再将不同区域适当组合,收取联票。而可以适合所有游客游玩的园林式景观等景区则应该采取一票到底的方式。另外,在制定门票价格时各景点应该考虑到自身因素,包括生态价值、历史价值、文化价值、政治价值、教育价值、体验价值、服务价值等;另外确定景点价值还常常需要在对比中考虑其稀缺性和珍贵性、体验过程中的愉悦性、以及消费过程中满意度等问题,这实际上就是自身价值和市场价值的综合。这样综合考虑景点各方面资源,才能制定出合理的价格。

2.对风景名胜区实行免票制的探索

当全国各地景点门票涨声四起时,世界著名风景旅游景区,西湖景区则实行免票制。而免票没有免效益,据杭州市“假日办”统计,2004年国庆黄金周期间,外地来杭游客达到140万人次。西湖南线未取消门票之前,每年的门票收入为600万元。取消门票之后,每年的总收入就已达到了700万元。可见免了门票并不一定带来效益的亏损,西湖虽然取消了门票,却换来了城市整体经济收入的增加,所以在旅游景点采取实行免票制这种办法是值得有关景点研究和借鉴的。

3.拓展景区景点的收入渠道

对于旅游资源的管理,旅游部门不能只盯着门票这一项收入,而应积极拓展收入渠道,广开财源。比如通过在旅游景点门票上刊印商业广告的方式,用门票的广告收益来弥补门票降价损失。或者利用景区内的商业门店收入、纪念品收入等多种收入与门票收入互补,为景区景点创造出更大、更持久的经济效益。

4.及时公布门票价格信息

对于旅游景点的门票价格,旅游景区景点应该通过网络、电视、广播等媒体及时公布自己的门票价格及其变动情况,增加景点收费的透明度。这样做既可以起到很好的广告宣传作用,又能给旅游者以信任感和好感。

三、结论

本文从博弈论的角度,通过构建博弈模型,并对博弈模型进行分析,得出单纯地采用对游客收取罚金和对抓住逃票游客的守卫给予经济奖励的方法,并不能对游客逃票的行为进行有效的控制。而对博弈模型的分析知,景点管理部门加大对未尽职的守卫惩罚力度,可以有效地减少逃票现象的发生。另外,景点管理应根据自身的实际情况制定合理的门票价格,并采用多种方法综合治理逃票行为,这样才能改善景区管理,增加景区经济效益。

参考文献:

[1]段治平李佳:我国旅游景点价格研究综述.粤港澳市场与价格,2007

[2]谢识予:经济博弈论.上海:复旦大学出版社,2002-1

[3]方列潘一峰:杭州公园门票“免”出大效益.

〈finance.省略/roll/20050111/08221284446.shtml>,

第7篇

关键词：网络安全；主动防御；非合作动态博弈；攻防博弈

中图分类号：TP393 文献标识码：A 文章编号：1674-7712 (2012) 16-0061-01

一、引言

在现有的网络技术中，一般采用安全策略配置的方法来设置网络防火墙，进而对网络起到保护作用，然而这类型的静态博弈方式有着一些弊端，比如，对于网络攻击者的供给意图和攻击策略无法实时的做出合理的应对，防御方式显得过于程式化，无法抵挡多变的网络攻击，对于一些瞬间和未知的攻击不能起到防御的作用。对于广大用户来说，最为安全、最为理想的防御系统，就应该具备对付所有攻击行为和修复系统弱点的效果。虽然这个想法有点不符合实际，但是整个方向还是相对正确的。因此在设置网络安全防御系统的时候，必须考虑系统的适度安全性。本文通过对非合作、非零和动态博弈理论进行了全面的分析，提出了相关的信息动态博弈防御模型，并且对完全信息和非完全信息条件下的适用场景做了科学的研究，体现网络安全防御技术的可操作性，以提高网络安全主动防御技术的水平，促进防御技术的改革与创新。

二、动态博弈的网络安全防御技术相关的定义描述

（一）完全信息动态博弈主动防御模型（ADDG）

（二）攻防博弈树T定义介绍

三、对于多阶段非合作动态博弈防御技术的分析

（一）攻防博弈树的形成

攻防博弈树可以用来表述完全信息网络攻防动态防御行为，因为攻防博弈树可以将参与网络攻击者和防御者的对抗形式和策略完全体现，可以通过攻防博弈树清楚地了解局中人的行动时间、行动方式、行动策略，以及在行动后的收益情况。

（二）多阶段非合作动态博弈算法简介

1.完全信息多阶段动态博弈逆向归纳法

在完全信息的网络状态下，结合攻防博弈树的防御技术，通过多阶段动态博弈逆向归纳法的计算，可以得出所有可能的网络攻击途径，以及网络防御的最佳策略。需要注意的是，在计算开始时，需要初始化攻防博弈树。

2.非完全信息多阶段动态博弈逆向归纳法

该计算方法，与完全信息多阶段动态博弈逆向归纳法的计算方式大致相同，是在完全信息状态无法满足时，演变而来的计算方法。该算法可以看成一个静态博弈过程，是在逆向归纳过程中，将所有信息节点集合组成一个子博弈树的过程。该算法中，当处于零和博弈状态时，计算相对复杂，为提高效率，需要博弈树中体现最少的非单节点信息集。

四、结语

传统的博弈网络安全防御技术普遍使用的是静态的博弈，这种静态的博弈方式对于网络攻击者的供给意图和攻击策略无法实时的做出合理的应对，防御方式显得过于程式化，无法抵挡多变的网络攻击。因此，非合作动态博弈的网络安全主动防御技术就应运而生了。网络攻防图和攻防博弈树的形成，对于网络动态博弈的主动防御有着深刻的意义，不仅可以提高网络安全主动防御技术的水平，还可以促进网络安全防御技术的改革与创新，以期为网络安全防御领域做出贡献。

参考文献：

[1]林旺群,王慧,刘家红,等.基于非合作动态博弈的网络安全主动防御技术研究[J].计算机研究与发展,2011.

第8篇

关键词：大学英语；网络自主学习；成才；博弈策略；受益最大化

博弈论是研究人与人之间互动关系的一种方法，它注重个人的自利行为是否受他人的影响。博弈本质上是人类的决策选择，特别是人们相互之间存在互动关系、策略对抗情况下的决策选择。博弈是指一些个人、团队成其他组织，面对一定的环境条件，在一定的约束条件下，依靠所掌握的信息，同时或先后，一次或多次，从各自可能的行为或策略集合中进行选择并实施，各自从中取得相应结果或收益的过程。每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中，在如此情形下进行决策，选择最有利于自己的战略。

自从网络自主学习被纳入大学英语课程教学体系，网络自主学习监控方面的问题逐渐彰显。目前我国对网络环境下自主学习监控策略的研究处于滞后状态，监控措施的不得当直接影响网络自主学习效果。按照西方博弈学家亚当·斯密的理论，每一个人都是一个“理性的经济人”，都会从利己的目的出发进行选择。本文运用博弈论，从“学校-教师-学生”博弈三方研究网络自主学习监控策略以及采取的措施，旨在为大学英语网络自主学习的监控提供切实可行的策略，拓宽了博弈论研究的领域。

一、大学英语网络自主学习监控收益分析

纳什均衡是以数学家约翰·纳什的名字命名的。纳什均衡是指每个博弈参与人都确信，在给定其他参与人策略的情况下，他选择了最优策略以回应对手的策略。纳什均衡是以数学家约翰·纳什的名字命名的，其最重要的性质是“自我强制性”。如果局中人就纳什均衡结局达成协议，那么就不需要任何外力的帮助，它自身就蕴含着保障实现的力量。完整的博弈应当包括五个方面的内容：博弈的参与者、博弈信息、博弈方可选策略、博弈次序和博弈方的收益，即博弈参与者根据博弈信息，选择适合自己的策略，依照博弈次序，使其博弈受益最大化。在大学英语网络自主学习监控博弈中同样包括五个方面的内容，其最终目的是使网络自主学习监控方和被监控方受益最大化。

根据大学英语网络自主学习“学校-教师-学生”三方博弈矩阵，学校（U）采取监控教师策略，教师（T）选择监控学生（S）大学英语网络自主学习策略，学生采取合作的策略按时按量完成网络自主学习，博弈三方的收益为1（U）、1（T）、1（S）。如果学校（U）采取不监控教师的策略，教师（T）选择对学生（S）大学英语网络自主学习不监控策略，学生采取不合作的策略不进行网络自主学习，博弈三方的收益最小化，分别为-1（U）、-1（T）、-1（S）。综上所述，只有博弈三方学校、教师和学生都采取合作策略，其受益才最大；如果采取不合作策略，则其受益最小。

二、大学英语网络自主学习监控博弈策略分析

（1）博弈条件。学校（U）采取的是一级策略，学校要创造网络自主学习监控的博弈条件。①建立网络自主学习网站；②开发网络自主学习平台和监控软件；③建设供网络自主学习的数字化语言实验室，配备网络管理人员；④规范网络自主学习的流程；⑤实施网络自主学习督导制，教学职能部门成立网络监控督导组，监督教师监控学生自主学习情况；⑥利用网络选课系统进行全员评教，建立教师评估体系，⑦修改教学计划，把大学英语网络自主学习纳入形成性评估体系，以确保受益最大化。

（2）大学英语网络自主学习监控博弈策略的实施。建立网络自主学习监控机制是利益最大化的保证。在大学英语网络自主学习中，学校、教师和学生博弈三方都确信自己选择了最优策略以回应对手的策略。在网络自主学习管理中，博弈三方要及时调整自己的策略，以限制需要外力的帮助的学生来实现网络自主学习。学校为了实施网络自主学习，首先制定监控教师的制度，教师为了监控学生的网络自主学习采取必要的策略，学生要及时给学校反馈教师监控网络自主学习的情况，达到博弈三方受益最大化。

学校—教师—学生博弈三方确定网络自主学习博弈策略后，进行实验教学。2012年9月采取随机抽样的方法，从全校选课的2012级大学英语读写译班中随机抽出4个班进行实验，2个班（151人）为试验组，2个班（189人）为对照组。由一位熟练掌握网络自主学习监控系统、教学效果较好，认真负责的教师同时担任实验班和对照班的大学英语读写译教学，监控学生网络自主学习的情况。在课堂教学目的、教学内容、教学手段和教学方法相同的情况下，对照组采取常规监控方法，即以上网时间为监控元素，评价方法为满2个小时得1分，实验组采取“学校-教师-学生”三方博弈策略。①学校博弈策略。博弈方学校是确保受益最大化的关键，学校对教师的监控是必要的先决条件。如果学校采取教学质量监控策略，教师就会积极监控学生网络自主学习情况。②教师监控学生的措施。博弈方教师采取二级策略。教师根据学校的规章制度、培养目标、教学模式等制定出自己的博弈策略，教师采取具体的措施：①以单元测试为监控元素；②以网络作业为监控元素，网络作业可以是翻译和作文等，网络提交作业的评分方式是质量与数量相结合。教师的博弈策略对于博弈的结果非常重要，教师的策略直接影响博弈效果。网络自主学习监控博弈属于不完全信息博弈，在不完全信息博弈中，后行动者依赖观察先行动者的行动来获取信息，先行动者的策略依赖后行动者的策略调整自己的策略。在网络自主学习监控过程中，有的学生采取不合作策略不能按时进行网络自主学习，如果教师听之任之，博弈双方的收益均为-1。为了确保网络自主学习利益最大化，教师应督促学生进行网络自主学习，调整自己的策略。当教师发现部分“自我强制性”差的学生违背了博弈的协定，教师应及时调整博弈策略，改变监控网络自主学习的策略。教师在批改网络作业时发现，“自我强制性”差的学生从网络上直接下载作文、粘贴、提交。教师立即采取对策，改变作业形式，让学生针对课文写综述或评论。③学生监控学校的措施。在网络自主学习监控博弈中，学生监控学校，学生对学校的监控可以是个人行为或集体行为。个人行为：学生可把学校和教师的网络自主学习监控情况直接反馈给学校的督导组；集体行为：利用网络选课系统每学期进行全员评教，评价教师大学英语网络自主学习的监控情况和效果。

三、监控网络自主学习博弈策略的效果

（1）对博弈策略的满意度调查。经过一个学期的教学实验，采取代表抽样的方法，从实验班中抽出93名学生，其中31名网络自主学习平均分较高者，31名较低者，31名处于中位者。利用Likert 量表进行监控网络自主学习博弈策略满意度问卷调查，每一陈述有“非常同意”“同意”“不一定”“不同意”“非常不同意”五种回答，分别赋值为5、4、3、2、1分，发出问卷93份，收回有效问卷93份。综合分析得知大部分的学生认同网络自主学习监控博弈策略，其累积加分较高的前两项为“反馈信息”（N=400分）、“全员评教办法”（N=388分），累计加分最低项为对网络自主学习策略不满意（N=256分）。分析结果得知学生对网络自主学习博弈策略是满意的。

（2）大学英语网络自主学习成绩统计分析。在教学实验过程中，对其效果进行检验，检验方法是每学完一单元，进行在线测试一次；每学期测试8次，试卷内容为词汇选择、阅读理解、完形填空和写作，满分100分。以2012～2013学年第一学期网络测试平均成绩统计为例，用SPSS 18.0对实验组和对照组的每个单元的平均成绩进行均值成对样本T检验，结果显示二组之间存在显著差异（P值=0.002，小于0.05）（表略），实验班的总平均成绩（85.25分）高于对照班的（79.46分）5.79分。

结论：在大学英语网络自主学习监控博弈中，学校应根据教师的博弈策略和学生的评教、信息反馈，及时调整自己的监控策略；教师应根据学校的博弈策略和学生大学英语网络自主学习情况，调整自己的策略和监控策略；学生应根据教师的策略进行大学英语网络自主学习。在大学英语网络自主学习中，只有学校、教师和学生都遵守博弈规则，师生采取合作博弈，才能确保其受益最大化，更好地促进学生成长成才。

参考文献：

[1]谢识予.经济博弈论[M].上海：复旦大学出版社，2007.

[2]范如国，韩民春.博弈论[M].武汉：武汉大学出版社，2006.

（河南大学大学外语教学部）

第9篇

关键词：有限次重复博弈静态博弈课堂管理

高校中流传着这样一句话：不逃课的学生不是好学生。现在的大学生似乎有着这样的观点，如果你不逃课说明你不懂得合理安排时间，不懂得最大化自己的效用，因为有些课确实是没用的。而许多大学生们就打着这样的幌子堂而皇之的逃课。老师们当然也有应对的措施——成绩，而出勤状况就自然而然的成为了成绩的一个组成部分，衡量出勤状况的最好方法则是点名。为了节省时间和避免他人帮忙的情况，点名的多种变形方式也随之出现，老师和学生间的博弈日益激烈。这学期选修了两门同是关于国际贸易的课程，却发现上课的出勤情况出现了截然不同的状况。虽然老师不同，但是却都是受人欢迎的老师，授课内容也与国际贸易有关，选课的人数也非常接近。一位老师偶尔抽点名，而另一位老师则是几乎每节课都签到。结果是一门课上课的学生很少，而另一门则坐满了整个教室。这样的情形在大学里却是很普遍，利用点名机制解决大学生逃课问题值得深入研究探讨。

1.文献综述

在国内，用博弈的方法研究高校学生出勤率问题刚刚兴起。有一些学者对其进行了一些探究，利用博弈模型解释存在的原因并且找出解决方法。

张忠德(2007)从学生与老师、学生与校方、学生与企业之间的博弈分析探讨大学生逃课现象存在的原因，进而针对性地提出解决方法。赵晓东(2008)运用博弈论知识，建立老师和爱旷课的学生之间的课堂点名博弈模型，用经济学的原理解释了学生旷课的本质原因。最后仅从老师的收益最大化为出发点，通过采取策略性行动来改善老师在此博弈中的收益，从而减少旷课现象的发生。沈智祥和陈晨(2008)用经济学的基本方法分析了大学生的逃课现象，分析表明逃课现象是经济行为人在课程市场信号传递强度及逃课成本的约束下，追求自身利益最大化的选择行为。预期收益与度量费用的比较，预期净收益越大，被选择作为市场信号的可能性越大，其市场信号传递强度越大。逃课成本取决于课程的性质特点。与此同时，师生之间的博弈，特别是在考核方式和制度约束的软硬程度，成为控制逃课现象的重要因素。汪晓文和张科(2006)举用博弈论的知识，建立一个关于学生逃课与教师点名行为的博弈均衡模型来解释日常学习生活中的这种学生逃课、老师点名的博弈现象。同时试图把模型分析的范围扩大化。

虽然学者们都利用博弈模型进行分析，但大多都只考虑了纯策略和混合策略纳什均衡，并没有通过不完全信息静态博弈和有限次重复博弈进行入手对实际的问题解析。本文将根据现实中的实际情况对这一问题进行解析。

2.理论基础

2.1有限次重复博弈

令G是阶段博弈，G（T）是G重复T次的重复博弈（T

2.2不完全信息静态博弈

在不完全信息静态博弈中，所有参与人同时行动，参与人i的战略空间Si等同于他的行动空间Ai，同时参与人i的行动空间Ai可能依赖于他的类型θi。用Ai（θi）表示参与人i的类型依存行动空间，ai(θi)∈Ai（θi）表示i的一个特定行动。用Ui（ai，a-i;θ)表示参与人i的效用函数。

贝叶斯纳什均衡：n人不完全信息静态博弈G={A1,…,An;θ1,…, θn;P;u1,…,un}的纯战略贝叶斯纳什均衡是一个类型依存战略组合{ai*(θi)}i=1n,其中每个参与人i在给定自己的类型θi和其他参与人类型依存战略a-i*(θ-i)的情况下最大化自己的期望效用函数vi。换言之，战略组合a*=(a1*θ1,…,an*θn)是一个贝叶斯纳什均衡，如果对于所有的i，ai∈Aiθi，ai*(θi)∈argmaxpi(θ-i/θi)ui(ai,a-i*θ-i; θi,θ-i)

3.现象解析

3.1运用有限次重复博弈模型

①现象描述

在国际贸易实务课上，老师说每节课都要签到，签到的情况会与成绩有一定联系，奖励来上课的同学。并且会通过字迹判断是否存在代签，如被发现会施以严厉的惩罚。这样的点名政策公布之后，每节课来上课的同学都非常多，基本上占满了整个教室。即使有一次没有签到，下一节课的人数也不会减少。

②模型分析

假设：（1）老师与学生都是理性的，且为共同知识，即老师会守信用按说的行动，而学生都是最大化自身的效用，并且签到得到的效用大于逃课。

（2）老师的类型确定，即为点名。

（3）这学期的课程数目确定为16节课，每节课均为一个阶段博弈，整个博弈为重复16次的重复博弈。

(4)老师为参与者1，所有学生同质只有两名参与者2、3

模型构建（单阶段博弈）：

均衡解析：此单阶段博弈中，只有一个纯战略均衡为（上课，上课），并且没有混合战略均衡，根据有限次重复博弈的定理，重复博弈的唯一子博弈精炼纳什均衡结果是阶段博弈的纳什均衡重复多次。因此（上课，上课）的均衡不会改变，且重复16次。由于学生是同质的，可以推出所有人的行动均为上课，因此每节课都会有很多人，即使有一次没有签到，也不会打破这样的均衡。由于老师的类型确定，学生没有偏离的动机。

3.2运用不完全信息静态博弈模型

①现象描述

在国际贸易理论课上，老师没有表明自己点名的偏好，刚开始的几节课并没有签到点名。而且对于期末考试的说明中并没有出勤成绩这一项。前几节课都有很多人，但随着课程的进行，听课的人越来越少，最后只剩下固定的寥寥无几的人了。即使有一次人数少的时候签到，老师也说明成绩中会考虑此次的签名，接下来的课程的人数仍然没有增加，反而减少。

②模型分析

假设：（1）自然选择老师的类型，即是否会点名，老师自己知道，但是学生不知道。学生的类型确定，即逃课的效用大于上课，但如果上课点名的效用大于逃课是共同知识。

（2）所有学生同质，简化为两名参与者为1.2

（3）学生有P的概率知道老师不会点名，1-p的概率知道老师点名，p为共同知识。

模型构建：

均衡解析：参与人1逃课的期望效用为 p*1+(1-P)*(-1)=2P-1

参与人1上课的期望效用为p*0+(1-P)*1=1-p

若p>2/3,则参与人1逃课的期望效用大于上课。由于对称性，参与人2也会是这样的均衡。因此若p>2/3，最后的均衡为（逃课，逃课）。由于学生是同质的，所有人在此概率下都会选择逃课。由于前几节课都没有签到，并且期末考试的说明中并没有出勤成绩这一项可知学生判定老师不点名的概率很大，根据最后的上课人数的减少，可以推算出概率大于2/3。这样的信号告诉了学生们老师不偏好点名，因此即使某一节课老师点名，也不能修正同学们的信念，上课人数还是得不到增加。

根据以上假设，博弈最终的均衡应该是都不去上课，但是与事实不符合。那是因为假设与现实不符，现实中的学生不是同质的，有些学生偏好上课，即使老师不点名。因此最后还是有好学生上课。

4.现象对比总结

根据对两个现象建立博弈模型分析中可以看到，即使两个老师是相似的，两门课程也是相似的，老师对于点名的态度不同，点名与成绩关联性的不同会最终影响上课的学生人数。可以得到初步的结论，良好的点名制度能有效的控制上课的学生人数，老师表明自己的偏好类型比不表明要好。老师应该尽可能在刚开始上课时表明自己的点名偏好，促使学生出勤率的提高，在一定程度上起到督促学生学习的作用。有些老师不想每节课都麻烦的点名，想通过抽查了解上课情况，这样不表明自己的点名行动会让学生在猜测中而找到逃课的借口，展开了博弈。学生与老师之间的博弈是激烈的，但同时也是不存在的。

许多人认为上课没有用，还没有自己看书有效率，但是老师常常会以出勤作为成绩的一部分，于是便有了这样的博弈。其实这都是为自己逃课找借口。每个老师都有值得让我们学习的东西，上课学的不仅仅是知识还有许多老师在潜移默化中交给我们的东西。因此上课并不是学生不得不做的事，而是有意义去做的事。当我们抱着这样的心态对待每一门课程，那么博弈自然就消失了。

博弈是一种智慧，但从某种角度上却又是一种投机的东西，当博弈不再是博弈时，才是它真正发挥作用的时候。当点名博弈不再存在的时候，那么这场博弈才是真正的成功。点名只能作为一种促进教学的工具，让学生们真正体会到上课的意义才是促进课堂教育提高的根本。

参考文献：

[1]张忠德.大学生逃课现象的博弈分析[J],民办教育研究,2007(3)

[2]赵晓东.课堂点名的博弈分析[J],管理观察, 2008(12)

[3]沈智祥,陈晨.经济学视角下大学生逃课的博弈分析[J],社会视野, 2008(5)

[4]汪晓文,张科举.逃课现象的博弈分析[J],高等教育研究,2006(3)

[5]张维迎.博弈论与信息经济学[M],上海人民出版社,2003

第10篇

【关键词】博弈论电力项目管理方法创新

随着经济的进步和科技的发展，电力市场逐渐繁荣和发展起来，电力建设项目增多。电力项目管理需要实现对电力工程成本、质量以及工期的管理，传统的电力项目管理方法很难实现对三大控制目标的有效平衡，很多情况下，电力企业为了保障电力项目质量，就要加大成本的投入，或是为了赶工期而忽视质量，这样不利于电力项目的建设。博弈论在电力项目管理中的应用不仅可以有效的解决这一难题，还会实现电力项目管理方法的创新。

1 国内外电力项目管理方法概述

（1）我国传统的电力项目管理方法。受技术和成本的限制，我国电力项目管理大致上经过了三个发展阶段，首先是建国初期的统包统管和外商包建模式，电力项目管理的重要性没有得到充分的认识，建设单位往往投入较大的成本，项目管理的专业化太低，电力项目管理的整体水平不高。其次是三方体制和指挥部模式，这一模式还是具有协调难度较大和管理水平较低的问题。自1988年以来我国开始学习工程项目管理模式，对电力建设市场进行了相应的改革，资本金制、法人责任制、工程监理制、招标投标制以及经济合同制逐渐应用到电力项目的建设过程中，电力项目的管理方式有了一定的进步和创新。

（2）国外电力项目管理方法。国外比较传统的电力项目管理模式是业主方进行项目管理。近年来，快速轨道方式以及阶段发包模式得到了快速的应用，该种管理模式可以最大限度的缩短工期，节省工程项目成本。BOT建造、运营以及移交管理模式是一种依靠私人资本进行基础设施建设的项目管理方式，代建制模式是依靠政府招标来选择合适的项目管理单位。电力项目管理模式不一而足，建设单位要根据工期、成本以及质量的问题，综合各种因素进行选择。

2 我国传统电力项目管理方法中存在的不足

随着改革开放的深入和电力市场的繁荣和发展，工程项目监理制度和招标承包制度逐渐引入了电力项目的建设市场，电力建设可以优先选择信誉较好的施工单位，这对提高电力项目工程的施工质量、提高投资效益以及进行科学决策都是有利的。但是，该种电力项目管理方式中，电力项目承包商和业主之间是对抗关系，承包商中标的价格较低，承包商以及业主在履行合约的过程中经常会遇到索赔问题。

（1）合同订立的问题。由于业主和承包商之间的对抗关系，只有规范化和精细化电力项目承包合同，一些模棱两可的问题才能有效的避免。由于电力项目的建设涉及到气候、地质和水文等很多不可控因素，在这种情况下，电力项目承包建设合同的条款越来越细，但是在电力项目的建设过程中，还是存在一些问题。业主和承包商均将合同作为争夺利益的方式，在一些问题不能及时解决的情况下，很容易引发问题甚至是诉讼。

（2）项目转包现象普遍。电力项目建设涉及的地区范围较广，很多电力项目建设的工期较长，电力项目建设过程中分包和转包的现象普遍。这也直接导致了不重视合同、体制和观念落后、法律法规不健全以及管理角色定位错误的问题，电力项目的施工质量、施工进度以及成本都很难控制。电力项目建设的损失较大。目前，我国虽然引进了工程招标投标制度，但是工程承包模式以及工程建设监理的模式还没有得到真正的解决，电力项目管理还存在众多的问题，现有的电力项目管理方法不能满足电力项目建设国家化的要求。

3 基于博弈论的电力项目管理方法新模式的提出

（1）博弈论概述。对于博弈论的研究始于19世纪，经济学家对金融寡头问题进行了深入的研究，1944年《博弈论与经济学》一书系统的阐述了博弈论理论体系，博弈论不仅在数学领域、经济学领域得到了快速的发展，还在经济、政治、生物进化等领域得到了重要的应用。博弈论在项目管理中的应用则是指通过承诺、协议和制裁而具有约束力。博弈是利益的分配，博弈论在电力项目管理中应用可以创新管理模式和管理方法。近年来，相关专家都对博弈论在电力项目管理中的应用进行了深入的研究，对质量、成本和工期项目管理对象进行了分析，并对施工行为和监理行为进行了分析。目前，博弈论在电力项目管理中的应用虽然是还没有系统的论证体系，但是博弈论可以改变电力项目管理中业主和承包商的对抗关系，促进双方之间信息的充分交流，实现双方利益的共赢。博弈论在电力项目管理中的应用不仅可以改善项目管理参与方信息不对称的问题，还可以降低信息交易成本，实现利益的共赢。

（2）基于博弈论的电力项目管理方法的提出。电力工程项目的建设也需要实现利益的最大化，参与方利益的共赢已经成为各方的共识。电力项目施工人员如果一天的工作结束之后拿到当天的工资，那么施工人员的工作积极性会大大的提升，项目管理人员还需要对项目进行定期的评价，针对项目管理中存在的诸多问题进行及时的调整，选择合适的解决方法，实现项目动态的管理与参与方信息的共享，进而实现项目参与各方利益的共赢。目前，基于博弈论的电力项目管理方法已经在一些电力工程项目建设中得到应用，项目管理方式也在不断的创新和进步。

4 基于博弈论的电力项目管理方法创新与实践

（1）团队的建设。随着社会用电量的增大，电力项目的建设已经得到了快速的发展，电力工程建设市场逐渐繁荣。但是，目前无论是电力项目管理人员还是施工人员都存在稳定性差、施工人员素质差以及投入与产出严重失衡的问题，这不利于电力项目管理方法的创新和进步。因此，电力工程建设单位要塑造良好的形象，只有提高了电力建设项目的效益，电力项目参与各方才能都获得收益。电力建设项目管理人员还要深入学习博弈论的内涵和意义，对质量、成本以及工期进行之间的影响与被影响关系进行深入的研究，提高管理的水平，提高管理的能力，减少成本的支出，拓展管理信息与专业技术的共享范围。

（2）信息传递方式的改变。参与方只有加强信息交流，缩短信息交流的时间，电力项目的建设和发展才能得到新的进步。基于博弈论的电力项目管理方法更有利于信息的交流和传递，避免施工过程中的信息不对称问题。目前基于博弈论的电力项目管理新方法已经逐渐应用到电力项目的建设和管理中，电子信息技术的应用加快了信息交流的速度，项目参与方可以实现方便和灵活的信息交流，降低信息传递成本，有利于参与方针对项目建设中出现的问题进行及时的协商，降低成本支出。

（3）合作机制的构建。基于博弈论的电力项目管理方法需要利益各方的信息交流和合作，合作的水平和程度取决于电力项目合作机制的运行状况。博弈论在电力项目管理中的应用需要管理人员对质量、成本以及工期进行综合的考量，对传统的项目管理方式进行创新和优化，实现更加主动性、组织性、计划性以及结构性的合作机制的建设，强化项目建设各方的协作和合作，对项目的投入和产出进行更加深入的研究，发挥项目管理人员在资源效用、技能以及经验方面的能力。此外，参与各方还要进行协商机制的建设，对出现的问题进行及时有效的解决，实现信息一体化、透明化以及讨论的实时化，实现电力项目管理人员在职业经验和技术技能经验的共享。

（4）激励机制的构建。项目管理的目的就是实现利益的最大化，施工人员是电力项目管理中的重要因素。电力项目管理的过程中可以引入激励机制，逐步创建内部激励和外部激励机制，可以对施工人员进行物质上和精神上的奖励，在充分考虑电力项目管理影响因素的基础上实现各种激励机制的结合，在各方利益的博弈中实现投资效益的最大化。

5 结语

随着经济的发展和人们生活水平的提高，社会的总体用电量呈连年上升趋势，电力建设项目逐渐增多。质量、工期和成本一直是工程项目管理的三大控制目标之一，电力项目的质量、成本和工期也是各方利益综合博弈的结果。很多情况下，电力企业为了保障电力项目质量，就要加大成本的投入，或是为了赶工期而忽视质量，这样不利于电力项目的建设。博弈论在电力项目管理中的应用不仅可以有效的解决这一难题，还会实现电力项目管理方法的创新。

参考文献：

[1]索迹，祁春清.博弈论在电力市场中的应用[J].科技信息（科学教研），2011（11）.

第11篇

高校宿舍使用大功率电器现象屡禁不止。本文运用博弈的思想和方法，通过学生与高校管理者的互动博弈，分析大学生使用大功率电器的演化规律，得出在当今管理机制下大学生使用大功率电器是一种必然趋势的结论。据此，从学生和管理者两个方面提出建立突发事件机制的策略方法，以减少大学生使用大功率电器的现象。

关键词：高校突发事件；学生；管理者；博弈

当今社会，各种危机层出不穷，高校也不例外。高校从其诞生之日起，就面临着各种校园突发事件的威胁，高校师生都会受到来自各方面突发事件风险的考验。高校宿舍大功率电器的使用更是诱发大学生人身安全突发事件的重要诱因之一。由国家教育部、公安部联合签署的《高等学校消防安全管理规定》于2010年1月1日起开始正式实施，其中第三章第十八条明确规定，“学生宿舍等人员密集场所，禁止违规使用大功率电器。”这就意味着在学生宿舍等人员密集场所使用大功率电器是一种违法行为。因此，高校禁止大学生在宿舍使用大功率电器是一种合法行为，更是减少大学生安全突发事件的重要手段。但是，高校宿舍使用大功率电器现象仍然屡禁不止。如何加强高校宿舍大功率电器使用管理，杜绝大学生在宿舍使用大功率电器现象已成为教育工作中一个亟待解决的现实而又紧迫问题。

但目前，关于高校大功率电器使用方面的研究成果非常匮乏，已有的成果主要采用定性分析的方法分析了大学生使用大功率电器的原因及对策，定量研究成果则很少。事实上，大学生在宿舍使用大功率电器是一个管理者和学生之间不断适应和动态调适的复杂演化过程。因此，本文试图采用定量分析的方法，即从博弈的角度出发，建立学生与管理者的博弈模型，对大学生在宿舍使用大功率电器的行为进行理性分析，并根据分析结果，提出相应的对策建议，以减少这一现象的发生。

一、高校宿舍大功率电器使用原因分析

高校宿舍大功率电器使用现象的产生原因是多方面的。唯物辩证法认为，事物的内部矛盾（即内因）是事物自身运动的源泉和动力。外因是变化的条件，外因通过内因而起作用。没有外因的刺激，内因就无法起到作用，双方共同推动事物向前发展。[1]高校宿舍大功率电器使用现象产生的根本原因是学生自律性差，缺乏安全意识，为了最求自身生活的便利舒适而置整个宿舍的安全于不顾，这是典型的自私行为。根据唯物辩证法，要想杜绝高校宿舍大功率电器的使用，除了大学生的自律内因外，还必须从外部原因找到推动力。事实上，大学生的自律，在当今社会主义市场经济条件下，还要依靠外部的各种监督。本文从管理者和学生双方博弈的角度入手，主要从内外部两个方面分析导致高校宿舍大功率电器使用现象，通过分析，得出结论，并提出相应的对策。

二、博弈分析

本文试图从演化的博弈角度，分析学生安全使用合法电器观念的树立离不开有效的内外双方的有效约束，只有这样，双方才能成为一种长效的最优化选择。博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。理论的基本出发点是具有个体理性的经济人追求自身利益的行为，主要研究行为和利益有相互依存性的经济个体的决策和相关均衡问题。[2]博弈论的主要研究方法是把现实世界中的行为体的冲突与竞争抽象概括为某种简化的博弈模型进行分析，当一个主体例如一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来也影响到其他人、其他企业选择时的决策问题和均衡问题。当将交易看作双方的策略行为时，对于各方的策略选择，可以通过博弈模型，分析交易双方的行动动机，并通过求解，确定交易的绩效。[3]

（一）基本假定

假定一：管理者认真履行职责的收益分成二种情况。当学生使用大功率电器时，管理者收益为 R1（现实学校生活中，管理者如果认真履行职责，基本上能发现学生在宿舍使用的大功率电器。这样，就能杜绝隐患保障宿舍的平安。）。当学生由于各种原因没有使用大功率电器时，管理者的收益为R3（此时，对双方来说，都相安无事，管理者仍然履行职责，坚持不懈检查宿舍，学生也不会因此而被处分）。

假定二：管理者敷衍履行职责的收益分成二种情况。当学生使用，管理者收益为R2（现实中，如果管理者敷衍了事，对待工作不认真，面对学生的隐蔽使用大功率电器，基本上是查不出来的，宿舍安全隐患非常明显，一旦发生意外，相关人员必将面临严惩。R2是非常小的，因此，R1> R2)。当学生由于各种原因没有使用大功率电器时，管理者的收益为R4（此时，管理者放松检查，腾出精力解决工作上的其他事务，但却不会出现宿舍安全隐患。这时管理者的收益R4> R3）。

假定三：学生使用大功率电器时的收益分成二种情况。当管理者认真履行职责时，学生收益为 G1（虽然可以偶尔方便使用一下，但此时学生肯定被查到，东西被没收，还要面临处分）。当管理者敷衍履行职责时，学生收益为G3（此时学生方便地使用自己的大功率电器却不担心被没收还处分）。

假定四、学生没有使用大功率电器的收益 G2（此时不管管理者认真与否，学生由于没有使用大功率电器，因此不再担心被没收与处分，因此相比其他情况下，G3>G2>G1）。

（二）博弈分析

基于前述假定条件的情况，本文尝试对四种情况下管理者和学生之间就是否使用大功率电器行为选择进行博弈分析。即管理者认真履行职责和敷衍履行职责下学生所采取的使用大功率电器和不用二种应对措施。

基于以上的参数，得出以下矩阵（第一个数字代表学生，第二个数字代表老师）。

博弈任一方的策略出发点是为了实现自身的利益最大化。在具体策略和利益相互依存性的博弈问题中，各个博弈方的利益既取决于自己选择的策略，还与对手博弈方选择的策略有关。因此，博弈方在决策时必须考虑对手博弈方的存在和策略选择。基本思路和方法包括上策均衡法、严格下策反复消去法、划线法和箭头法等。他们各有特点。上策均衡法、严格下策反复消去法适宜绝对优劣关系的博弈，而划线法适用于较强的博弈分析方法，是以策略之间的相对优劣关系为目标。基于本文的特点，采用划线法来进行博弈分析。[1]

在表1中，管理者和学生作为博弈参与人（players）都有两种选择，认真或敷衍；学生是使用或不用，它们共同构成四种战略组合，每种战略组合下的两个数字分别代表管理者和学生的受益，前一个数字代表学生的受益，后一个数字代表管理者的受益。

在这个博弈中，对管理者来说，假设博弈方学生采用的策略是“使用”，则博弈方管理者认真履行职责得益是R1，敷衍履行职责得益R2，由于R1> R2，此时管理者的最佳对策是认真管理。为了便于记忆和分析，我们在矩阵中策略组合（使用，认真）对应的博弈方老师的效益R1（矩阵左上角数组中第二个数字）下划一短线，表示这是博弈方管理者在博弈方学生选择认真时的最大得益。同样，对于管理者来说，博弈方学生采用不用策略时，老师选择敷衍为最佳策略。对应的是（不用，敷衍）里的R4，我们也在下面划一短线。

同理，对于学生来说，思路同管理者是一样的。当管理者认真履行职责时，学生使用大功率电器可以获得G1的利益，学生不用大功率电器的收益为G2，由上述分析可知，G2> G1。因此，我们在（不用，认真）里的G2下划横线；同时，如果管理者敷衍履行职责， G3>G2，因此，我们在（使用，敷衍）G3下面划上短线。

在表1中，每一对策略都有一个划线部分，这就是说，在双方博弈中没有最佳的选择，每一策略的选择都有赖于对方的行动。这种博弈反映了一个深刻的问题，即学生的理性与管理者的理性的冲突，双方的理性导致在现实中无法实现对双方都有利的最佳选择。在该博弈中，对于学校而言，最佳选择是学生自觉不用大功率电器，老师履行职责，精力不用浪费在查这类事件上，节省物力与财力转到其他方面的工作，整个校园出现和谐的环境。事实上，由于现实世界中的一些假定在高校中大量存在，在高校要想减少这一类安全隐患的出现，在目前的状况下是很困难的，这也证实了现在高校宿舍内使用大功率电器屡禁不止的原因了。

三、对策建议

学生使用大功率电器的安全隐患是非常突出的，每年经常出现宿舍失火或线路跳闸现象。虽然学校也挤入了大量的人力进行宣传与突击检查，但收效甚微。实现校园宿舍安全和谐的氛围是一个长期的、持之以恒的过程，需要学生与管理者共同合作。改变高校学生使用大功率电器的状况必须从以下二个方面来加强：

（一）从学生的角度考虑，要加大学生违章的成本，减小违章的收益

首先，从思想上对学生进行思想教育，灌输安全第一的意识。从大一新生入学开始，就开始使用各种宣传手段进行这一方面的教育，使其形成一种“使用可耻，不用光荣”的良好习惯思维。其次，学生要克服“大功率电器情结”。[4]现在部分学生懒惰，不愿意走出宿舍到开水房打水，只想着自己很方便地在宿舍用热得快烧水，用电饭锅煮快餐面，至于使用的后果，天真地认为事故与自己无关，存在侥幸心理。最后，建立常态检查体系。一旦有违规记录，一方面没收电器，另一方面，通报所在院系，进行相关处分。那就是要让学生明白，使用违章的大功率电器的收益G1要远远小于不用的收益即G2。

（二）从管理者的角度考虑，要加大检查力度与频率，工作上不能走马观花

首先，管理者自身要进行必要的政策学习，进行相关的思想政治教育，加大职业道德的责任心意识教育。其次，进行职责明确的分工，一旦由于工作上的失误与不负责任造成的事故，必须追究相关人的责任。最后，学校要加大后勤的硬件投入，改善学生的生活条件，尽量做到让学生方便用到热水，使学生意识到，即使不用大功率电器，同样可以收到很好的效果，这样，就会使学生充分尝到不用的好处，从而逐渐减少使用大功率电器的可能性。

参考文献

[1]凌志东.企业诚信缺失：企业与消费者的博弈分析[J].江苏商论，2011，（5）.

[2]谢识予.经济博弈论[M].上海：复旦大学出版社，2002.

[3]Prajit K. Dutta.策略与博弈――理论及实践[M].上海：上海财经大学出版社，2005.

[4]曾涛，邓瑶，陈芸.“大功率电器问题”，孰对孰错[J].安防科技，2010，（4）.

第12篇

［关键词］电子商务重复博弈信用问题

一、引言

伴随着互联网的普及，C2C电子商务迅速发展起来。近年来，国内外许多学者对C2C电子商务信用问题进行了相关研究。纵观国内外学者的研究，大多认为诚信问题是电子商务市场进一步发展急需解决的。意识到第三方监管、信用评价系统的重要性。本文结合前人的研究，以博弈论为主要研究工具，通过一次博弈和重复博弈分析了电子商务市场存在失信行为的内在原因，通过有三方监管存在的博弈模型分析了电子商务失信行为的外部环境原因。在此基础上给出解决电子商务诚信问题的根本方法。

二、模型分析

1. 一次博弈

C2C电子商务交易主体之间必然从一次性博弈开始。因此，一次博弈是电子商务交易主体相互信任行为分析的基础。在进行一次性博弈分析前，先给出下列假设：

(1)电子商务交易主体都是理性的。(2)C2C电子商务市场的信息是完全的，即博弈各方对对方的支付函数、战略空间都有完全的了解，即双方是完全信息下的博弈。(3)双方的策略是同时采用的，没有先后顺序，也不为对方所知。

假设在电子商务交易活动中，买卖双方都选择诚信，他们的收益给为R，如果只有一方选择诚信，诚信交易方收益为-R，失信方收益为2R；如果双方都选择欺诈，则交易无法完成，收益各为0。由此构造出的一次博弈模型及收益矩阵如表1。

表1 一次博弈收益矩阵

在一次博弈的条件下，战略的选择取决于带来收益的大小。

2.重复博弈

C2C电子商务市场是一个参与人不固定的重复博弈，一次博弈后有概率进行下一次博弈，每个阶段博弈结构与表1相同。重复博弈中所有参与人都能观察到各方过去的博弈行为，买卖双方在多阶段博弈中采用“冷酷战略”。即交易一方首先选择诚信；如果交易另一方也选择诚信则下一阶段博弈中交易一方选择诚信；一旦在博弈某阶段一方选择不诚信，则交易另一方将永远选择不诚信。设参与人的总收益是所有阶段获得的利益的“贴现值”之和。即

其中， U为重复博弈各阶段收益总现值；为各阶段博弈的收益；为贴现因子；n表示博弈发生的次数。

因此可得交易一方在每一阶段博弈中都选择诚信的总收益如果交易一方在第一次博弈中选择不诚信，收益为，由于交易另一方采用冷酷战略，因此随后的n-1次的博弈中双方都选择不诚信，收益均为0。因此先采取不诚信行为遭到对方冷酷战略的总收益。如果，即，交易双方的最优策略是诚信。因此，交易双方采用“冷酷战略”时，只要重复博弈概率，博弈双方就会选择诚信继续合作。再次交易的概率决定着交易双方诚信行为的选择，概率越大，诚信的可能性越大。

3.第三方监管情况下的博弈分析

由一次博弈可知，交易双方依据自身的收益选择策略时，C2C电子商务市场陷入无效的“囚徒困境”状态，通过重复博弈过程可知，再次交易的概率决定着交易双方是否选择诚信策略，再次交易的概率越大，则诚信的可能性也越大。

假设交易双方都诚信的收益为M；一方诚信而另一方失信，则诚信方收益为-F，不诚信方收益为K，被监管方发现的概率为q，罚金为C；双方都不诚信则交易无法完成，收益均为0。其中F>M。卖家诚信概率为P。博弈矩阵如表2

表2 第三方监管下的博弈矩阵

如表所示，买家诚信的期望收益为：,不诚信的期望收益为。当买家诚信时期望收益高于失信时的期望收益，及时，也就是卖家诚信的概率时，买家会选择诚信。而卖家诚信的概率p与罚金c和被监管方发现的概率q相关。当q和c的乘积越大，则的值越小，卖家诚信的可能性就越大。

三、结论

目前，我国电子商务市场正处于成长期，相应的法律法规还不完善。C2C电子商务市场的交易很多是一次性的，即使出现不诚信交易，也很难从法律角度定性，买家也会因很多的客观原因放弃追究。在这种情况下建立良好的诚信机制显的尤为重要。

参考文献：

[1]CNNIC.第27次中国互联网络发展状况统计报告[R].中国互联网络信息中心，2011，1：36-37

[2]Yoon,S.J. The antecedents and consequences of trust in online purchase decisions. Journal of Interactive Marketing.2002,Vol.16(2):47-63

[3]李程晨，谢武.基于不完美信息的我国C2C交易动态博弈分析[J].产业与科技论坛，2008（7）：137-139

博弈分析方法

第1篇

第2篇

第3篇

第4篇

第5篇

第6篇

第7篇

第8篇

第9篇

第10篇

第11篇

第12篇

电子科技大学学报·社科版

政治人类学评论