时间:2022-03-14 19:00:03
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇统计与信息论文,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
在电子专业硕士研究生教学中,信息论课程是必修基础理论课程,但由于其与数学联系密切、理论性强、内容抽象,导致学生缺乏学习兴趣和效率低下。为促进学生更好地掌握课程内容,笔者从课程的教学内容、教学方法与考核方式三方面进行一系列教学探索,提出“三个强化、三个联系、三个引入”的改革措施。实践结果表明,这些措施有效地改善了课程教学效果,提高了学生的学习积极性、知识掌握程度和应用知识解决实际问题的能力。
关键词:
信息论;研究生教学;教学改革
《信息论》是本校电子科学与工程学院电路与系统专业硕士研究生(学术型)的专业必修理论课程,也是一般高等院校通信与信息工程、计算机科学与技术、电子科学与技术等一级学科下相关专业的本科生、研究生的主修专业课程[1-5]。通过对本课程的学习,使学生掌握有关信息论的基本理论以及编码的理论、实现原理和具体应用。虽然人们在本科生的《信息论》教学改革方面做了一定的工作[6-9],但其改革内容不符合电路与系统学科特点,更不符合研究生教学需要。笔者结合本学院学生基础、学校政策及本人近年来的教学实践,在学校研究生教学改革项目支持下,开展了本门课程的教学改革与实践。
一、课程特点
1.需要坚实的数学基础。该课程存在大量的公式推导与证明,与概率论、随机过程、近世代数等数学知识密切相关。若无扎实的数学基础,学生无法看懂推导过程,更无法从根本上理解信息论的数学意义及物理含义。
2.学生学习兴趣不高。由于电子专业硕士研究生的数学基础仅限于本科生学过的概率论与随机过程,对近世代数的了解几乎为零。学生面对繁杂、抽象的理论问题时,无法宏观地理解和把握,致使学生无法提高学习兴趣。
3.课程联系实际困难。课程抽象概念多、定理证明多,与实际应用有一定距离,且与其他课程联系较少。多数学生在学习过程中觉得内容枯燥、难度大,而且与将来就业方向联系较少。鉴于以上问题,为了激发学生学习的积极性和主动性,促进学生更好地掌握本门课程,笔者从课程的教学内容、教学方法与考核方式三方面入手,提出了教学改革的相应措施。
二、教学内容改革———三个强化
1.强化离散信息论的基础作用。信息论的主要内容是信源概念、信息度量方式及三个香农基本定理,相应的内容又分别面向连续信源与离散信源。二者的区别在于,连续信源/信道及相应的定理一般需要结合随机过程知识来学习,而离散信源/信道及相应的定理是建立在概率论、线性代数的基础上。从推导过程和公式形式来看,二者具有内在的统一性。这可从连续信源信息熵的推导过程看出:将连续信源进行离散化,变为离散信源后再利用离散信源信息熵的求解公式并求解极限得到。因此笔者重点强化了对离散信源、离散信道及其容量、无失真信源编码定理、无失真的信源编码的内容。这对学生进一步掌握连续信源、信道及相关问题奠定了基础。
2.强化信息论的现实物理意义。笔者从课程本源出发,让学生理解公式或定理蕴含的深刻物理含义,使理论结果可视化,概念直观化。例如,在讲解离散信源的极值性定理时,可提炼出如下物理含义:第一层含义是,当信源各取值的概率相等时,人们对信源取何值的不确定性最大,由于各信源服从等概率分布,信源的平均不确定性即为各事件的不确定性,因此信息熵也越大;第二层含义是,对于具有不同数量事件的两个信源,若二者同时满足等概率分布,则预测数量较多事件的信源的难度较大,因此该信源的信息熵也较大。
3.强化教学案例的实用性。在本次教学改革中,共自创或搜集教学案例11例,每个教学案例都与教材内容有关,将晦涩难懂的理论内容变为鲜活的例子,让学生去感受和体会案例中蕴含的问题,从而为更好地理解教学内容奠定基础。以引入的六个视频教学案例为例,该案例以美国国家航天局发射的新火星探测器为背景,讲解了信息如何传播、如何加密等问题。通过这部分教学案例的学习,学生深刻地认识到了信息论的价值与实践意义。
三、教学方法改革———三个联系
1.联系计算机仿真。笔者鼓励学生应用MATLAB中SIMULINK工具设计具体的通信系统模型,如基于开关键控或正交频分复用的射频通信系统。让学生看到实验现象的同时,更加深刻地体会信息的传递过程,了解信源、信宿、信道的构成,学习信源编码、信道编码、加密、信道译码、信源译码等信息处理过程,加强学生对信道容量、信息传输速率、误码率等概念的把握。笔者督促学生将上述问题作为课程设计的作业,使其结合信息论所学的知识,提炼出相关问题、建立模型,加以认真分析解决;再将提炼问题和解决问题的过程以及结论进行汇总,撰写成研究报告。这既巩固了学生的基础知识,又锻炼了学生运用计算机进行建模和仿真的能力。
2.联系工程实际。由于研究生日常的工作大多在实验室从事工程项目的研究或开发工作,若能将这些工作与信息论知识联系到一起,无论对信息论的学习还是科研都将起到促进作用。笔者首先开展了调查研究工作,统计了各个学生从事科研项目的情况,然后让学生结合课程知识,从信息获取、处理、传输、存储的角度去解释。例如,在讲述信息不增性原理时,笔者结合温度传感器的设计问题:将大气环境温度看成连续信源,将传感器系统看作信道,将显示终端看作信宿。因此,设计该系统的关键问题———如何设计传感器才能最大化地得到信息而不丢失信息?学生带着这个问题去思考,就可以真正地体会传感器中信息传递过程。
3.联系科学前沿。为鼓励学生大胆创新,笔者尝试将科学前沿技术引入信息论课程,例如,室内、外可见光通信技术。笔者结合自己近年来从事可见光通信研究的经历,向学生讲授了可见光通信系统的设计、研制、实验测试等一系列过程;然后结合信息论课程所学的知识,将其与研制的可见光通信系统联系在一起。笔者也鼓励学生探索与信息论相关的科学前沿问题,开展课堂讨论与课下交流。让学生查询保密学、光学信息论等方面的文献,详细阅读并做总结。然后,切实提出自己的想法,再予以验证,从而将学生所学知识真正地和科学前沿结合在一起。
四、考核方式改革———三个引入
该课程原来采取任课教师命题、纸质考试方式。其弊端在于,教师命题规律和出题形式规定,学生只要做一遍往年考试题目,就可得到较高的分数。虽然这种考核形式能在一定程度上反映出学生的知识水平,但却无法体现其学术水平和实践能力。为此,笔者在考核方式上做了三个引入的变化。
1.引入随堂能力测验。随堂能力测验是考查学生运用所学信息论知识分析解决实际问题的能力。由于采取随堂考试形式,因此,对学生课堂学习效率和前期积累提出了较高的要求。例如,在学习香农公式时,笔者考查了学生运用香农公式计算射频通信所需带宽的问题;在学习无失真的信源编码时,笔者考查了应用霍夫曼编码对离散信源进行编码的能力。该测验在总成绩中占10%的比例,从而激励学生很好地利用课堂来学习知识。
2.引入学术论文加分。提升学术水平是研究生教学的任务之一。笔者针对信息论教学中每章的重点问题,均设置开放性的论题供学生选择,让其查阅文献、资料,进行认真的设计、理论推导、计算机仿真、现场实验,并将其总结成文,然后以学术论文的形式提交。笔者根据学生在文中阐述的观点、论证的严密性、结论的正确性与普遍性等方面予以考核。学术论文在总成绩中占20%的比例,是本次教学改革的重点。
3.引入上机考试。往年的信息论期末考试中,题目是由任课老师自行拟定。由于种种原因,考试题目重复率高、知识点考查单一,这给学生突击考试并取得好成绩提供了可能。为此,笔者将期末教师出题测试改为上机随机抽题考试。笔者建立了试题库,题型包括:客观题(选择、判断)、主观题(概念、简答、计算、综合)。在本校计算机学院协助下,建成了信息论上机考试系统,学生登陆系统后,按照教师设定的题目数量和难度,随机抽取试题。上机考试的在总成绩中占据70%的比例,也是这次教学改革的重点。该考核方式经试运行后,效果良好。
五、结语
笔者根据电路与系统专业信息论课程的特点以及目前教学中存在的问题,从教学内容、教学方法及考核方式三个方面提出了相应的改革措施。通过本次的教学实践证明,采取的这些措施有效地改善了课程教学效果,提高了学生的学习积极性、知识掌握程度和应用知识解决实际问题的能力。
参考文献:
[1]陈运.信息论与编码[M].北京:电子工业出版社,2007.
[2]叶中行.信息论基础[M].北京:高等教育出版社,2002.
[3]李梅.信息论基础教程(2版)[M].北京:北京邮电大学出版社,2003.
[4]曹雪虹.信息论与编码[M].北京:清华大学出版社,2003.
[5]吴伟陵.信息处理与编码[M].北京:人民邮电出版社,2005.
[6]李迎春,等《.信息论与编码》教学改革探讨[J].科技信息,2010,(20):18-20.
[7]邓家先.信息论与编码课程教学改革探讨[J].电气电子教学学报,2007,29(2):111-114.
[8]高宏峰,彭勃.信息论基础课程教学改革探究[J].洛阳师范学院学报,2010,29(2):160-161.
[关键词]信息论与编码;云计算;SPOC;教学理念
[中图分类号] G642.0 [文献标识码] A [文章编号] 2095-3437(2017)05-0017-03
信息论与编码课程[1]是我校信息与通信工程专业重要的专业基础课程之一,是一门运用概率论和数理统计等数学工具来研究各类通信系统的一般规律以及通信系统各组成部分统计特性的综合性强、涉及学科广泛的课程。
信息论是现代信息科学的重要组成部分,是现代通信、信息技术飞速发展的理论支撑。信息论与编码课程的学习要求学生具有良好的数学基础。课程涉及积分运算,矩阵运算,群、域、环的概念和理论,数值分析的理论,计算机迭代算法,香农三大定理的证明等,几乎涵盖了理工科学生所学的全部数学知识。同时课程中很多概念非常抽象,比如信息、自信息量、平均互信息等,为教学带来了很大困难。教学过程中学生普遍反映公式定理繁杂、枯燥、难懂,内容、概念抽象,难于理解,学习兴趣不高,因而教学往往达不到预期的效果。
近年来,大型开放式网络课程,即MOOC(massive open online courses)的兴起突破了传统课程时间、空间的限制。同时,随着云计算技术的成熟,依托互联网,学生随时随地就可学习到国内外著名高校课程。然而,目前网络开放课程的应用仍然存在一些问题,比如学习者间缺乏交流协作,由于参与者众多,导致师生互动不足、教学效果考察手段欠缺,传统平台缺乏灵活性,都阻碍了网络开放课程的广泛应用,造成了许多优质教育资源的闲置与浪费。
本教学小组尝试将基于“云计算辅助教学”( Cloud Computing Assisted Instructions,CCAI)的SPOC(Small Pri?鄄vate Online Course小规模限制性在线课程)教学模式引入信息论与编码课程教学中,积极探索并设计出新的有利于促进学生自主学习,提升其创新思维和工程实践能力的全新教学模式,以提升人才培养质量,实现信息论与编码课程教学管理信息化、资源建设动态化、师生交流常态化、学生学习终身化的可能,使学习无处不在、无时不在。
一、CCAI和SPOC简介
(一)云计算辅助教学
美国国家标准与技术研究院(NIST)[2][3]定义云计算是“一种提供可用的、便捷的、按需的网络访问, 进入可配置的计算资源共享池,这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互的模型”。
CCAI[4]是目前较为前沿的信息化教育技术,是指学校和教师利用云计算支持的教育“云服务”,构建个性化教学的信息化环境,支持教师的有效教学和学生的自主学习,促进学生思维能力和群体智慧发展,提高教育质量的教学模式。CCAI的意义,不是简单的教学方法的转变,而是教育理念上的重大变革,其广泛应用必定开创教育的新时代,加快我国教育信息化的进程。
(二)SPOC教学方法
SPOC即小规模限制性在线课程[5][6][7][8]( Small Pri?鄄vate Online Course),是混合学习视角下对MOOC 的一种延续和创新。与MOOC使教师有机会服务于全球不同,SPOC让教师更多地回归校园,回归小型在线课堂,将在线教学与传统课堂教学完美结合,真正实现翻转课堂[9][10][11][12]与混合教学。课前,教师是课程资源的学习者和整合者,根据学生需求整合各种线上和实体资源。课堂上,教师是指导者,组织学生分组研讨,随时为他们提供个性化指导,共同解决遇到的难题。与传统课堂相比,SPOC的在线视频教学使学生们的参与度更高,同时可以激发教师的教学热情和课堂活力。
二、开展基于CCAI的SPOC教学模式在信息论与编码课程教学改革的必要性和意义
信息论与编码课程是我校电子信息与通信工程专业一门重要的专业基础课程,具有课程内容抽象,涉及数学基础知识广泛,公式复杂、众多及数学推导繁杂的特点。学生学习兴趣不高,使教学达不到预期的效果。
目前,以学生为主导的个人学习环境成为网络学习发展的必然趋势。[13][14][15][16]CCAI和SPOC的新理念和新方法,可根据学生不同学习风格和水平提供个性化学习的支持服务,将促进教育信息化的发展和教育观念的改变。
基于CCAI的SPOC教学模式具有以下优势:
(一)学习方式不受时空限制
采用线上线下相结合的混合式教学模式。首先教师将学习内容、相关参考资料和教学视频等存放在云计算平台中,学生根据自己的时间利用终端访问所需的学习内容。
教师在课外对线上自主学习环节,应给出本次课的重点和难点、关键问题,为学生查询相关资料提供指导,降低学生自主学习的盲目性,从而提高翻转课堂的教学效果。
(二)自主学习和互动学习相结合
在基于CCAI的SPOC教学模式下,学生可根据自己的基础知识掌握情况自主选择相应的学习模式进行学习。学生可通过虚拟社区,与教师、同学进行互动交流,解决学习中遇到的困难。知识讲解环节不再是传统的灌输模式,而是针对学生自主学习时的盲点或理解不正确的地方进行详细、重点的讲解,自主和互动式学习将提高学生学习课程的积极性和主动性。
(三)提高学习兴趣
以“教”为中心的教学,缺乏自主创新意识,难以调动学生学习的能动性,学生无法感受学习的乐趣以及解决问题的成就感。而以学生为中心的教学,能够充分发挥学生的自主能力和创新能力。将全新的技术引入教学中,能够激发学生的学习热情,变被动学习为主动作为。
(四)实现学习资源共享
各级教育机构、高校和教育企业建设了大量的教育信息资源,我们正在实现传统教育资源库向云服务环境的转变。[13]学生不仅可以使用本校的教学资源,还可通过云平台使用其他高校的资源,从而提高资源的利用率。比如,我校可提供上海交通大学、西安电子科技大学、国防科技大学的信息论国家精品课程,MIT 开放课程,Stanford 的信息论课程等。
坚持以“培养能力为导向”,以“服务学生为核心”的基本原则,课堂教学模式正从以教师讲授为主,逐步转变为以学生自主获取知识为主导。每个学生可根据自己的学习情况选择有针对性的在线学习,以更好地实现“因材施教”。这正是我们提出基于CCAI的SPOC教学模式的意义和目的所在。
三、开展基于CCAI的SPOC教学模式在信息论与编码课程教学改革中的基本思路
在CCAI的基础上采用SPOC教学方法,首先需要建设优质的教学视频资源,其次要设计在线运行系统和课堂运行系统,并设置配套的考核体系。在对CCAI和SPOC 进行深入了解之后, 本教学小组结合信息论与编码这门课程的特点,提出了基于CCAI的SPOC教学模式在信息论与编码课程教学改革的基本思路, 具体阐述如下:
从信息论与编码课程的内容来看,其强调基础性和实用性,包括信息论基础知识(理论)和香农三大定理(实践)两大部分内容。SPOC建设也是围绕这两方面展开,如图1。
(一)基础知识――通过基于CCAI的SPOC实现混合教学[7]
学生在课前自主学习阶段以观看教学视频为主。优质的视频教材是激发学生自主学习的重要因素,通过观看教学视频学生完成知识的第一次内化。教学视频的制作则成为一个非常重要而且艰巨的任务。
制作教学视频时,需要注意以下几个方面:①教学内容,应针对某一个特定的问题,不宜过于深奥。② 时间长度的安排控制在学生注意力比较集中的时间范围内,一般为5-10 分钟。③ 录制形式多样化。④在视频中融入问题、任务、作业等元素,以督促学生学习,确保学习质量。
以往的教学经验显示,学生对基础理论知识的掌握并不理想,这部分内容应采用“课前预习―课堂讲授(研讨)―课后练习”方式进行教学。在线教学视频提供课前预习的知识要点,结合小组讨论,帮助学生明确课程的重、难点。由于做了课前预习,在课堂讲授中,学生的听课效率会明显提高,开展课堂讨论也更为容易。
(二)香农三大编码定理(实践)――通过基于CCAI的SPOC实现翻转课堂[8][9][10][11][12]
在完成基础理论学习的基础上,通过SPOC 教学方法来实现翻转课堂,进一步调动起学生自主学习、自我探索的激情。
SPOC的翻转课堂采用的是线上线下相结合的混合式教学模式。在线教学要起到指引的作用,教师在在线教学中依据教学内容设置具有针对性,能暴露学生知识的漏洞,引发学生的创新思考,引导学生学会学习,帮助学生思考的问题。学生预先对教学核心内容进行自主学习,查阅参考文献,撰写阅读笔记,进行初步的小组研讨。
在师生互动方面,可以在学习本课程的学生中建立一个讨论群,教师讨论问题,让学生随时参与讨论。教师可以通过云空间平台布置作业,建立试题库,试卷,学生在规定时间内完成所有作业和试卷。
在这种模式下,学生可以随时登录平台进行学习,也可在交流区进行在线讨论,教师在线答疑解惑,突破了传统课程时间、空间的限制[5][6][7][8],但这需要学习者具有较强的自律性和自主学习能力才能按时完成课程学习内容。
课堂上教师不再以“讲授知识”为主,而是将更多的时间与精力用于有针对性地答疑解惑、组织深度研讨等。
(三)考核体系设计
为了提高教学质量,达到较好的教学效果,教师需要设置严格的考核体系。
根据信息论与编码课程的特点设计相应的考核体系,包括线上考核(教学视频的观看率、习题完成的正确率、讨论交流的发言率),课堂考核(考勤、课堂提问、小组研讨),论文撰写(阅读笔记、专业论文写作),期末考试(课堂测试、在线测试)等方面。
总之,基于CCAI的SPOC 教学方法需要充分运用云空间技术建设丰富的视频资源,设置合理可行的课堂内外运行系统和严格的考核体系。[14][15][16]
四、结语
以往的教学实践和相关文献显示,信息论与编码课程的教学中存在两个核心问题:一是课程内容抽象枯燥,教学手段单一,难以调动学生学习的主观能动性;二是现行的考核方式单一,导致学生在理论知识掌握与工程实践能力上失衡。
针对这些问题,本教学小组提出基于CCAI的SPOC 教学模式,并应用于信息论与编码课程教学中;牢牢把握SPOC教学的精髓,构建自主学习和交互学习的课堂,坚持以“能力为导向”,以“服务学生为核心”的基本原则;注重学生综合实践能力和创新能力的培养,强调学生自主学习能力的培养,以期最终达到提高教学质量的目的。
[ 参 考 文 献 ]
[1] 傅祖芸.信息论――基础理论与应用[M].北京:子工业出版社,2001.
[2] 云计算定义 [EB/OL].[2012-11-19].http://baike. baidu. cora/view/1316082. htm.
[3] 美国国家标准与技术研究院――云计算定义[EB/OL]. [2012-11-13].http:// nist. gov/itl/cloud/index. cfm.
[4] 黎加厚主编.云计算辅助教学[M].上海:上海教育出版社,2010.
[5] 康叶钦.在线教育的“后MOOC时代”――SPOC解析[J].清华大学教育研究,2014(1):85-93.
[6] 任莺.论基于MOOC的“SPOC”教学新模式――以广告设计基础课程为例[J].亚太教育,2015(34):100-101.
[7] 韩万江,张笑燕,陆天波,孙艺.基于SPOC的混合式教学模式课程建设初探――以“软件项目管理”课程为例[J].工业和信息化教育,2015(11):38-42.
[8] 韦昌法,刘惠娜.基于SPOC的“离散数学”翻转课堂教学改革初探[J].新课程研究(旬刊),2015(5):39-40.
[9] 邹景平. 翻转课堂的起源与成功[J].中国远程教育,2012(14):81-82.
[10] 杨刚,杨文正,陈立.十大“翻转课堂”精彩案例[J].中小学信息技术教育,2012(3):11-13.
[11] 金陵.“翻转课堂”翻转了什么[J].中国信息技术教育,2012(9):18-19.
[12] 马秀麟,赵国庆,邬彤.大学信息技术公共课翻转课堂教学的实证研究[J].远程教育杂志,2013(1):79-85.
[13] 徐苑苑.云计算环境下的开放课程应用研究[D].上海:华东师范大学,2013.
[14] 闫娜.基于百会云平台的云计算辅助教学在高职教育中的应用[D].西安:长安大学,2013.
[15] 闫娜.云计算辅助教学在高职教育中的应用研究[J].办公自动化(综合版),2015(8):61-62.
[关键词] 管理学研究方法
管理活动自有人群出现便有之,与此同时,管理思想也就逐步产生,但以泰勒(Taylor)的名著《科学管理的原理》以及法约尔(Fayol)的名著《工业管理和一般管理》为管理学诞生的标志,那么现代意义上的管理学至今不到100年。在不足100年中管理学的理论研究者与学习者实践者、管理学方面的著作文献等等均呈指数上升,显示了作为一门年轻学科勃勃向上的生机和兴旺发达的景象。
20世纪初,以泰勒、法约尔和韦伯等人韦代表的古典管理阶段,其核心内容是科学管理、管理职能分析、古典组织理论等,古典管理理论侧重于“物”的管理,研究方法以工业工程方法为基础。20世纪30年代到50年代是以梅奥韦代表的人际关系学说及随后发展的行为科学理论阶段,研究的重心转向“人”,研究方法上注重采用心理学、社会学、人类学和实验研究方法。20世纪60年代以后,管理学的发展被孔茨描述成“管理理论丛林”的阶段,孔茨的两篇著名论文《论管理理论的丛林》和《再论管理理论的丛林》分析归纳得出,截止1980年为止管理学至少已发展有11个学派,包括管理程序学派、行为学派、群体行为学派、社会系统学派、决策理论学派、系统管理学派、经验主义学派、权变理论学派、管理科学学派、社会技术系统学派、经理角色学派等,各个学派从不同的角度研究管理问题,提出各自的理论,在研究方法上也体现了多样性和创新性,系统论、信息论、控制论、数学、统计学、经济学等研究方法出现,极大的丰富了管理科学研究,在此基础上,孔茨认为所谓“学派”更适合称为“方法”。
一、系统论、信息论和控制论研究方法引入管理学研究领域
系统就是由相互作用和相互依赖的若干组成部分结合成的具有特定功能的有机整体,系统方法就是按照事物本身的系统性把对象放在系统的形式中加以考察的一种方法,即从系统的观点出发,始终着重从整体与部分(要素)之间,整体与外部环境的相互联系、相互作用和相互制约,系统中各部分即使并不优越,但构成协调一致相互配合的统一整体却可产生优越的功能。反之,即使各部分是优越的,缺乏协调统一相互联系和制约的整体可能并不优越。系统论应用于管理科学,是用系统理论和观点来考究企业组织,分析组织的构造是对管理要素、管理组织及管理过程进行系统性分析,旨在优化管理的整体功能,实现管理的最佳目标和效率。控制论描绘了管理形态和运动规律的多样性,强调系统的反馈和前馈控制,研究方法主要包括反馈控制、功能模拟和黑箱辨识。信息论将运用概率论等方法研究通讯和控制系统中信息传递和信息处理的科学引入了管理研究。以耗散结构理论、协同论和突变论为代表的系统自组织理论,重点研究系统自发形成具有充分组织性的有序结构的内在机制。这些理论将组织看作系统,不仅关注系统的各个部分,而且更加注重系统各个部分的联系,信息的传递、控制及系统的自组织因而成为各不相同但是又紧密相关的一个体系,强调实现组织的整体功能和效率。
二、以数学(包括统计学)为基础的研究方法的引入
近年来,数学方法在管理学研究中越来越活跃,主要运用于建立模型和进行定量分析,常用的数学包括统计学、组合数学、数学规划、离散数学等。所谓定量分析,就是用数学的语言(数学表达式、图、表等)和数据(数字、符号、图片等)描述所研究对象系统的状态并分析其变化发展规律的研究活动或内容。尽管一些人指出单纯的数学模型并不能完全解决现实的复杂的管理问题,更不能完全替代人的管理,但是以管理科学学派为代表,以数学为基础的定量研究方法正在管理领域的因素量化、建立模型和定量分析方面展开研究,特别在电子计算机及网络技术的推动下,数学研究方法正在深入渗透管理科学研究领域。上面提到的系统论、信息论和控制论也主要是以运筹学等数学理论为基础,包括数学规划(线性规划、非线性规划、动态规划)、图与网络、对策论、决策论、排队论和可靠性理论等,由此可见,系统分析也是定量化分析,分析方法是组织管理技术,管理中的最优目标选择、统筹规划、人员匹配以及计划决策等无一不是系统论(运筹学)所包容的内容。根据John G. Wacker的研究,1991年~1995年运营管理(operation management)的研究表明,55.19%的论文都采用了数学分析方法。
三、案例研究方法的使用
经验主义学派和权变理论学派两个管理学派都高度重视案例研究方法,虽然二者在研究思路上又各有不同――经验主义学派侧重于研究个体企业管理实践,在服务于个案研究这一目标之下,才考虑做多个企业案例的比较研究与归纳、概括;而权变理论学派侧重于通过多案例研究,归纳、总结出若干基本模型,以指导管理实践。例如,经验学派彼得・德鲁克受通用汽车的雇佣,对其组织结构进行案例研究,1946年出版的《公司的概念》便是这一研究的结晶。《公司的概念》出版四年后,几乎所有的西方大公司都开始按照德鲁克的理论框架重组自己的公司组织结构,甚至连大学和教会都试图从这部著作中汲取组织改造的灵感。目前无论是在战略管理或组织管理领域,还是在管理会计、市场营销管理、生产作业管理、信息技术管理领域,都可以看到丰硕的案例研究成果。战略管理、目标管理、计算机集成制造、项目管理、流程再造、风险管理、供应链管理、核心能力、公司文化、追求卓越、知识管理、平衡计分法等等都存在出自于案例研究过程的产物。例如,Prahalad和Hammel(1980)对日本电气公司(NEC)与美国通用电话电报公司(GTE)进行了详细的比较研究,总结出NEC告诉成长的经验时提出了核心竞争能力。经验或案例学派的主要观点大致如下:(1)管理应侧重于实际应用,而不是纯粹理论的研究;(2)管理者的任务是了解本机构的特殊目的和使命,使工作富有活力并使职工有成就,处理本机构对社会的影响相对社会的责任。德鲁克认为,作为企业主要管理者的经理,有两项别人无法替代的职责。第一项职责是创造出一个大于其各组成部分的总和的真正的整体,创造出一个富有活力的整体,把投入于其中的各项资源转化为较各项资源的总和更多的东西;第二项特殊职责是在其每一项决定和行动中协调当前的和长期的要求。为此,每―个经理都必须:制定目标和措施并传达给有关的人员;进行组织工作;进行鼓励和联系工作;对工作和成果进行评价;使员工得到成长和发展。(3)实行目标管理的管理方法。当然,经验主义学派的方法由于强调经验而无法形成有效的原理和原则,无法形成统一完整的管理理论,而且,过去所依赖的经验未必能运用到将来的管理中。正如孔茨在他的书中指出的:“没有人能否认对过去的管理经验或过去的管理工作‘是怎样做的’进行分析的重要性。未来情况与过去完全相同是不可能的。确实,过多地依赖于过去的经验,依赖历史上已经解决的那些问题的原始素材,肯定是危险的。其理由很简单,一种在过去认为是‘正确’的方法,可能远不适合于未来情况”。
四、经济学研究方法进入管理学研究领域
关键词:信息隐匿,压缩编码,数据变换,数据选择
1 引言
信息隐藏是一门新兴的信息安全技术。论文参考。涉及感知学,信息论,密码学等多个学科领域,涵盖信号处理,扩频通信等多专业技术。 近年来得到了迅猛发展。现阶段人们一般选择图像、文本、音频和视频等数字媒体作为载体。另外, 还出现了基于TCP/IP 的信息隐藏技术和基于信道编码的信息隐藏技术。本文研究的基于压缩编码的信息隐藏技术是信息隐藏技术的新领域, 它以多媒体系统中的压缩数据作为嵌入载体,数据解压后不影响原始数据数据的结构和统计特性, 具有较强的鲁棒性和不可检测性。
2 压缩编码信息隐藏的原理
压缩编码是一种提高数据传输有效性的技术,它是通过对数据施加某种操作或变换使之长度变短或者容量变小的同时, 还必须保证原始数据能够从压缩产生的压缩码中得以精确的还原。从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去掉确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原有冗余的描述。这个本质的东西就是信息量(即不确定因素)。信息隐匿和数据压缩在本质上是相互联系的:对于数据压缩来讲,一块数据中隐匿了和数据本身无关的地的其它数据,那这块隐藏了信息的数据是有一定冗余的,由冗余的数据可以进一步被压缩,进一步压缩的就有可能去掉隐匿的数据;对于信息隐匿来说,一块已被压缩过的数据冗余量已经很小了,由于隐匿是嵌入的数据和原始数据毫无关系,在这块数据中进一步隐匿数据,势必造成原始掩护数据的有效数据的减少,相当于队已经压缩的数据进行进一步压缩。只要保证在接收端解压中可以恢复原始数据的差错率,就可以在压缩编码后进行信息隐匿,不会引起截获者怀疑码字载体中含有秘密信息。
3 压缩编码信息隐匿模型实现方案
基于信息隐匿和数据压缩的关系,提出结构如下的数据压缩思想的通用隐匿模型。模型主要由三个部分组成:图像压缩、信息加密和信息隐匿。图像压缩部分的量化器输出至信息隐匿部分,然后从信息隐匿部分得到隐藏有其他信息的量化数据,并送到熵编码器,其他内容和标准压缩过程一致。信息加密部分为传统的加密方案,其主要目的是增加秘密信息的安全性,使得系统隐匿的信息部分即使被检测出来,也不会泄露其内容。论文参考。
信息隐匿部分是模拟最核心的内容,这部分主要有三个部分组成:数据变换,数据选择和嵌入过程。数据变化的主要目的是改变加密后的信息统计特性,使得这些数据嵌入掩护图像量化后的数据之中,不改变或很少改变掩护图像的数据统计特性,从而使信息隐匿后的抗检测性大大增强。数据选择是从掩护图像量化后的数据中选择合适的比特位,用它来隐藏已加密的信息。合理的数据选择算法应该兼顾信息隐匿的容量,信息隐匿的抗检测性与鲁棒性。嵌入过程式将加密后的信息和选择出来的数据进行某种运算(通称为替换或异或),用运算结果替换选择出来的数据,并将此数据连同未选择出来的量化数据一并交给图像压缩部分的熵编码进行编码。
图1 基于数据压缩思想的通用信息隐匿模型
通用模型的秘密信息提取过程基本上是隐匿的逆过程,其流程图如下
图2通用信息隐匿模型的信息提取过程
压缩后的数据首先经过熵解码器解码,然后进行数据分离,将未嵌入的数据部分送入正常的图像解码流程(反量化,反映射变换),而将嵌入数据的部分进行数据提取,如果此过程的算法不是盲的(即需要原始掩护图像),则需要分离出来的数据和原始掩护图像经映射变化,量化后的数据进行运算,将结果进行数据恢复、解密、最后得到嵌入的原始秘密信息。
4 隐匿模型的两种关键技术
在这种通用的信息隐匿模型中,数据变换和数据选择是关键技术
数据变换的主要目的是改变加密后的信息统计特性,增强系统信息隐匿的抗检测性能。改变数据的统计特性的常用方法是进行线性滤波,从本质上来讲,线性滤波和线性变换是一致的,从频域上来看,滤波就是对信号频谱的不同部分进行不同的缩放。在技术上常就是这样一个过程:DFT→相乘→IDFT,将这一过程合并为一体时,就成为一个单纯的线性变换。在复数域中进行整数的可逆处理时,数据量就会增加一倍,为此可以经DFT换成DCT,这样这一处理过程就成为一实数域的线性变换问题。
下面介绍整型变换算法的基本过程。
(1)对于给定的线性变换A,如是常见的线性变换,则进行(2),否则对其进行改造,使det| A ‘ |=1。
(2)将A ‘ 分解为3类基本矩阵(置换矩阵,元素的绝对值均不小于1的对角阵,单位三角矩阵)。
(3)对于每一基本矩阵,构造其整型变换,获得整数输出。
(4)对于每一步都应有相应的逆变换,所以整个变换的逆变换可以相应的获得。
(5)对于多维可分离的线性变换,正变换可以逐维的计算;为了保证逆变换对于多维数据的完全重建,应严格按照和正变换相反的次序进行逆变换。
实现数据变换时的另一个问题是数据的范围问题。在实际处理过程中,输入的数据都是有一定的范围的(比如原始图像数据通常用8位无符号数据表示),如果输出的数据不加以限制,则输出的数据的范围一般要增大,这样就必须用更多的数据表示处理结果。
数据选择过程是从掩护图像的量化数据中选择合适的比特位,用它来隐匿已加密的信息。最基本的做法是选择掩护数据中的不重要的部分,这样做得优点是对掩护图像的质量影响最小,使修改引起别人注意的可能性最小。但是在实际系统中,数据选择算法应该兼顾信息隐匿的容量,信息隐匿的抗检测性与鲁棒性等多个方面的性能,可以选择下面三种。
1.LSP(LeastSignificant Portion)最不重要部分
LSP技术和LSB(最不重要比特位)技术基本类似,区别在于LSB平等的对待掩护图像中的每一字节,不同的字节之间没有区别,在隐藏时都在数据的最低位取相等比特;而LSP针对变换量化后的数据而言,不同位置的重要程度不同,从中所取的最低有效比特数就不同,其中低频数据是取得少一些,而在高频数据中取得多一些。另外,不同位置的数据取值范围也不一样,最多的可取比特数也不一样。论文参考。
2.随机间隔法
随机间隔技术是以LSP为基础的一种方法,在数据选择时用一个掩密密钥k作随机数发生的种子,那么可以生成一个随机序列k 1 ,…,k l ,并且把它们一起按下列方式生成隐匿信息位置来对经LSP选择的数据进行进一步选择:j 1 =k 1
j i =k i +j i-1
从而可以伪随机决定两个嵌入位置的距离。这种方法由于隐匿的位置更少,所以更不容易被检测出来。
3.随机位置法
随机位置技术是另外一种伪随机的方法,它也以LSP技术为基础。和随机间隔法不同的是,它对不同的位置变换数据及量化数据的不同比特位赋予不同的选择概率p 1 ,…,p l ,在数据选择时也用一个伪装密钥k作为随机发送的种子,那么可以生成一个一个随机序列k 1 ,…,k l ,当k i ≥p i 时选择比特,否则不进行选择。在此方法中选择合适概率取值方案可以兼顾信息隐匿的容量、悬念吸引你的抗检测性与鲁棒性等多方面的性能,是一种更灵活的方法。当然可以将随机间隔法和随机位置发结合起来使用,那是一种更灵活、更复杂的方案。
5 实验结果
运用本文提出的通用模型,以lena(512像素×512像素),作为掩护图像,在其中隐匿随机数据,映射变换采用8×8的DCT,经数据变换过程,结果如下图所示。图中从左到右,从上到下依次为:原始图像,未嵌入数据的JPEG图像,嵌入不等数据量的JPEG图像。随着嵌入数据量的增加,掩护图像的直观质量会下降,这种质量的下降类似于不同压缩比条件下JPEG图像质量的不同下降,从信息隐匿的角度来看,这种相似性是有利的。
图3 图用模型的数据隐匿效果
6 小结
研究了一种基于压缩编码的信息隐匿技术,介绍了信息隐匿通用模型的两种关键技术:数据变换和数据选择技术,通过实验得到嵌入量与图像质量的关系。随着通信技术的不断发展,信息安全将成为一门很重要的学科,对于通信信息隐匿还要寻找更先进,更合理的算法来达到通信的安全性能。
参考文献:
[1] KATZENBEISSERS, PETITCOLASFAP.信息隐藏技术—隐写术与数字水印[M].吴秋新,钮心忻,杨义先等译.北京:人民邮电出版社,2001.
[2] 汪小帆,戴跃伟. 信息隐藏技术方法与应用[M].北京:机械工业出版社,2001.
[3]柏森,胡中豫,吴乐华等.通信信息隐匿技术[M].北京:国防工业出版社,2005.
[4]王伟祥, 刘玉君.基于信道编码的信息隐藏技术研究.[J] 电视技术.2003(3).
关键词 维纳;控制论;传播学
中图分类号G206 文献标识码A 文章编号 1674-6708(2012)66-0003-02
诺伯特·维纳(Norbert Wiener,1894-1964)是美国著名数学家,控制论的创始人。维纳一生240多篇,著作14本。其主要著作有《控制论》(1948)、《维纳选集》(1964)和《维纳数学论文集》(1980)以及两本自传《昔日神童》、《我是一个数学家》。维纳的控制论思想对工程学、计算机科学、生物学、哲学以及社会学都产生了巨大影响。本文主要探讨维纳控制论对传播学的影响。
按照维纳的观点,传播问题可以视为通讯问题和控制论问题,即传播问题就是对若干危险情况进行秩序的和可重复的控制。本文认为,维纳从控制论的思想出发,为传播描绘了一个理想的途径——一个关于传播的乌托邦。也正是维纳的控制论催生了传播学的一个重要派别帕洛阿尔托学派,启发了多伊奇开创了政治传播学,并最终为施拉姆创立传播学奠定了基础,同时也为北美技术学派提供了理论支撑。
1 控制论和传播学的帕洛阿尔托学派
控制论推动了传播学研究模式的转型,最为显著的影响是催生了传播学研究的帕洛阿尔托学派。事情还要从香农的信息论说起。在维纳发表《控制论》的同一年,维纳的弟子香农发表了《通信的数学理论》一文,标志着另一门新兴科学信息论的诞生。在这篇文章中,香农提出了一个关于一般通信系统结构的模型。他认为,所谓通信,就是两个系统之间传递信息,由信源发出信息,通过信道传递信息,再有信宿(收信人)获取信息,这就构成通信系统[1]。
香农的线性传播模式描绘了信息传播的一般路径,因其简单明了、可量化,很快影响到了美国传播学研究的路径,主导了美国传播学研究的主流模式,所有的功能主义和效果研究都以香农的线性传播模式为最基本的假设。也是在这一年,拉斯维尔提出了传播的“5W”模式,这也是传播的线性传递模式的经典表述。必须看到,“大多数传播是双向的”[2]。香农和拉斯维尔的线性传播模式过于简单化而受到强烈的质疑和诟病。这种线性因果关系也正是维纳所坚决反对的,控制论本身是一种概率论,因果关系是建立在概率统计的基础之上的,或一因一果,或一因多果,或多因一果,或多因多果,这是一种或然性的世界观。
贝特森这位帕洛阿尔托学派的奠基者,曾经是梅西基金会议的核心成员和积极分子,在1942年有关神经系统中心抑制的一次会议上,贝特森就从维纳那里引入了反馈的概念,可以说,正是梅西会议使得维纳和他的控制论思想影响到包括社会科学在内的多种学科,为传播学提供了肥沃的土壤。在1946年的第一次“控制论小组”会议上,贝特森受到计算机“是—否—是—否”之间摇摆的悖论的启发,并将之运用于人类传播的问题,后来用在传播互动理论中,在这个小组“始终如一地最受到欢迎的模式是一种源于控制论的系统理论。这个模式能够对付以一种自我纠正的方法彼此响应的交往要素,而家庭成员似乎就是以这种自我纠正的方法来行事的。传播技术开始成为这个领域的语言的组成部分。”他们反对传统的线性传播模式,主张人类的传播问题应该由社会科学的模式来研究,因为哪怕是最小的互动情景都是非常复杂的,不可能在一个线性模式中用两三个变量实现[3]。
贝特森认为,系统内在于行动中,形成于我们所观察到的互动中,这一点与功能主义截然不同,功能主义认为行动是系统的产物。源于控制论的帕洛阿尔托学派改变了系统论的中心,使其从抽象的普遍性转向微观。他们的格言是“我们不能不传播”。帕洛阿尔托学派的贡献在于,它指出了人类行为的全部都应被纳入社会科学的研究范畴,这“在超越线性逻辑的道路上迈出了一大步”[4]。
2 控制论和多伊奇的政治传播理论
如果说戈夫曼和凯瑞侧重于研究互动情景下的人际传播的话,那么受到维纳控制论思想的直接启发,美国学者卡尔·多伊奇则开创了传播学的一门分支政治传播学。多伊奇的政治传播理论主要体现在他的代表作《政府的神经》一书中。
多伊奇把控制论的基本原理和方法应用于政策制定过程的分析,并于1963年发表了其代表作《政府的神经:政治沟通与控制的模式》,形成了系统的政治传播理论。因此,一般政治学者认为,多伊奇是政治传播理论的主要代表人物之一。多伊奇的政治传播理论,深受维纳控制论思想的影响,甚至可以说,正是维纳的控制论思想构成了多伊奇政治传播理论的基本框架。他说,“从控制论的角度看,所有的组织都具有某些相同的特征,即所有的组织都是经由传播维系在一起的。[5]”他认为,传播不同于物质和能量的传递,传播是信息的传递。正是传播,即信息的传递,形成了组织。
多伊奇回忆说,“本书(《政府的神经》)开始于1943年,当时数学家罗伯特·维纳走进了我在麻省理工学院的办公室,用了一支雪茄烟的功夫,就把我引入长长的交流过程。这次谈话从讨论我的领域,即国际政治开始,但是很快就转向了他自己的关于传播、关于机械、动物和社会的通信和控制的工作。他拥有我曾遇到的最强有力和最具创造性的头脑。我于1958年到耶鲁大学后,我们仍然保持着密切的联络,直到他于1974年逝世,我们仍然是非常亲密的朋友。[6]”多伊奇以生物体的神经作比喻,认为正是传播构成了政府的决策的神经系统。
多伊奇的政治传播理论,把决策视为政治活动的中心,把传播看作是决策的环节。他认为政治系统与自动机器有相似之处,政治系统内部的机制对信息的接受、选择、储存、分析和处理就是传播。政治系统对环境的适应与控制是通过传播完成的。传播关乎社会的稳定。“信息”和“反馈”是政治传播理论的两个核心概念。政治系统要达到自己的目标,需要从各方面接受涉及体系目标的、有关环境变化情况的信息,然后对这些信息进行选择、储存、分析和处理,最后形成决策。政策制定后,政治系统通过反馈过程,获得政策执行过程和政策在环境中引起的变化的信息,使决策者正确地调整自己的政策和行为。从传播的角度分析,政治系统的决策过程包括:信息接收、资料处理、储存、决策、政策执行、执行效果和反馈7个环节。多伊奇的政治传播理论,考察了政治系统的控制方式和决策过程,并提出了完善信息系统必须注意的一些主要环节,从而为人们了解、分析、研究和完善政治系统提供了一个新的角度和方法。
3 控制论和施拉姆开创的传播学
一般认为,传播学孕育于19世纪末至20世纪30年代,形成于20世纪30年代~50年代的美国。尽管眼下学界对传播学诞生的时间还存在一些争议,但传播学作为一门学科在高校“登堂入室”、确立自身的学科地位,确定无疑是在20世纪40年代末50年代初。威尔伯·施拉姆(WilburLangSchramm,1907年~1987年)是传播学科的集大成者和创始人。作为“传播学鼻祖”、“传播学之父”,1947年他创办了第一个大学的传播学研究机构——伊利诺伊传播学研究所;1949年他编撰了第一本传播学教科书《大众传播学》。施拉姆还授予了第一个传播学博士学位,他本人也是世界上第一个具有传播学教授头衔的人。
控制论和传播学几乎同时诞生,这不是偶然的。施拉姆写到:“20世纪40年代末,香农与韦弗合著的《通讯的数学理论》和维纳的《控制论》问世,这使传播学者非常兴奋,因为他们觉得,熵之类的概念有可能用来研究人类传播。” 他认为,控制论和信息论这些新的研究方法,“开启了研究人类传播的一系列重要的洞见”,“对研究人类传播的意义重大。”罗杰斯甚至认为,维纳的控制论本身就是一个传播理论,因为控制论“涉及信息如何在两个或以上单位之间进行流通[7]”。
为了捍卫传播学的学科地位,表明这门新兴学科系出名门,施拉姆制造了“四位奠基人”的神话。我们不能否认“四位奠基人”对传播学做出的贡献,但比较而言,维纳和他的控制论对传播学的影响可能要更大些:控制论不仅为传播学提供了一套完整的术语,而且为传播描绘了一个清晰的路径,这样一个路径由于引进了反馈的概念而彻底颠覆了以往的线性传播的模式,并且主导了美国功能主义和效果研究的传统。
维纳控制论对传播学的影响是巨大的。控制论的贡献就在于提出假设并加以测试,再度拾起人文科学实现统一并与自然科学和生命科学融为一体的宏大梦想。施拉姆说,控制论和信息论之所以“给传播学者留下了极为深刻的印象”,有两个原因,“首先,虽然起源于通讯工程和技术,但它为传播研究提供了一些可作比拟的借鉴,可以指明社会科学里的许多传播概念;其次,它提供了种新的数学理论,该理论既可以用于研究电子通讯,也可以用于研究人类传播。[8]”在这一点上,作为“传播学之父”的施拉姆和作为“控制论之父”的维纳走在了一起。
参考文献
[1]王雨田主编.控制论、信息论、系统科学与哲学[M].北京:中国人民大学出版社,1986:285.
[2][美]威尔伯·施拉姆,威廉·波特著.传播学概论[M].何道宽,译,北京:中国人民大学出版社,2010:46.
[3]陈力丹著.传播学是什么[M].北京:北京大学出版社,2007:65.
[4][法]埃里克·麦格雷著.传播理论史[M].刘芳,译.北京:中国传媒大学出版社,2009:65.
[5]Deutsch·K·W.The nerves of government: models of political communication and control[M].New York:Free Press,1963:77.
[6]Deutsch·K·W.The nerves of government: models of political communication and control[M].New York:Free Press,1963.
中图分类号:f222 文献标识码:a
在过去的2008年,是一个多事之年,我国经历了自然灾害和世界金融危机的轮番冲击,经济增速回落,然而我国经济发展的步伐并没有因此而止步,随着社会发展的速度,国内企业统计工作的改革也日益提上日程,在当前的经济形势下,就企业统计工作的改革,本文将予以分析。中国
1 经济形势介绍
2008年,总体来说,经历国际金融危机的冲击后,我国农业生产形势依旧良好,消费需求增长较快,通胀水平也在进一步回落。但全球经济衰退不可避免,因此对我国的经济发展也有一定的负面影响,世界经济减速导致的全球性需求减少引起我国2009年上半年出口量下降,使得国内低水平生产能力过剩的矛盾突出。为此,我国中央政府适时出台了四万亿的经济刺激计划来扩大内需,在2009年的上半年,国内经济已经呈现回暖的趋势,cpi消费者指数在今年2月份出现负增长,与此同时,工业品出厂价格指数也在逐月下降……这一切都在说明中国政府的经济振兴措施已经取得了初步成效,呈现出积极迹象。正因为如此。很多国外的学者和机构都视中国为这场危机的救世主,认为中国的经济将推动全球经济走出经济危机的阴影。
2 目前我国国内企业统计工作现状
对企业来说,统计工作就是通过建立一套合理有效的统计管理模式,准确及时把企业的产、供、销的数据较全面、较具体地反映出来,把感性认识变为一组组供领导和决策者参考的数据,统计工作的作用是不言而喻的。在此,在当前的上述的国内经济形势下,本文对国内企业统计工作的现状及存在的问题进行分析。
2.1 认识不到位
统计工作存在的诸多问题中,根本的一点就是企业领导对统计工作的认识不够,因此导致企业管理者和统计人员对统计工作的性质认识模糊、并对其重要性了解甚微。很多企业的领导者都认为统计工作只是简单的数据记录和计算,统计数据就是填填数字及报表,对企业的管理和经营决策没有指导和参考作用。
2.2 统计方法、手段有待改进
在当今的信息化的经济环境中,国内很多企业的统计工作的方法和手段都亟待改进,有的甚至还是改革开放年前的统计方法和手段。例如很多企业的统计工作都是以手工统计为主,未能实现统计方法的信息化。
2.3 统计指标落后
当前,企业经营者重视的是市场信息、经营质量、经营环境等经济运行质量指标,而政府和行业主管部门统计系统则要求企业上报以经济总量指标为主、经济运行质量指标为辅的指标系统,导致企业管理者对自身企业统计的信息不感兴趣,集中地说明了企业统计指标的落后不科学,不能适应市场竞争的需要。
2.4 统计监督机制缺陷
由于国内企业的管理者对统计工作的认识不足,及对其的重视不够,使得国内企业的统计监督机制存在缺陷或不健全,统计人员与会计人员混用,统计数字经常被随意修改,大大降低了统计工作对企业经营管理的作用,降低统计信息的有用性。
3 企业统计工作的建议
为适应经济发展的步伐,需对企业的统计工作做出改革,以面对新的经济形势对企业统计工作提出的挑战,从而更好地为企业管理者服务,提供有用的统计参考信息。
3.1 转变认识
首先,应该从根本上加强企业管理者及相关人员对统计工作的认识,使其加强对统计工作的重视,要彻底地认识到企业统计工作的重要性和作用。因此企业领导和相关的统计人员则应该多学习现代统计概念,应认识到统计工作在一定程度上可以提升企业整体的竞争实力,所以应该转变认识,加大统计工作投资力度。
3.2 改善统计方法、手段
改善企业统计工作的方法和手段势在必行,企业应该加大对统计工作的投资力度,争取实现统计工作信息化,可根据国际企业的成功经验采用erp企业资源计划系统来全面根本上改善企业统计方法,能节约时间并能有效提高统计工作效率,从而,更好地为企业领导者管理决策提供统计信息。
3.3 设置适宜的统计指标体系
企业应该根据经济发展的环境来设置合适的统计指标体系,来综合反映企业的整体运营情况。因此,企业在追求效益的同时。要根据自身的经济情况来量身打造适宜的统计指标体系,适当的时候并可设立专题性指标体系,从而使得指标体系既能反映企业运转情况又能够与政府统计要求相适应。
3.4 加强统计监督力度
统计工作的监督机制是不可或缺的,其重要性是不可言喻的,企业在对日常统计工作的各方面进行改革的同时,也要对其自身的统计监督机制进行改革和完善,提高统计数据的真实性和统计工作的全面性。
3.5 人才培养
企业在追求自身发展的同时,应该注重对统计人才的招募和培养,以备不时之需,应该对企业统计人员定期开展培训来提高技能,使其获得了现代化统计概念的同时,又能熟练操作统计工作的现代化工具,从而更好地为企业服务,提升统计信息的准确性。
当前,我国还未能彻底地走出经济危机的负面影响,经济未实现全面复苏阶段,基于此特殊阶段,国内企业统计工作改革的步伐刻不容缓,需要不断地适时改革来促进国内企业统计工作的发展,对企业发展及我国经济发展意义非凡。
参考文献
[1]苗敬毅.对市场经济条件下企业统计的思考[j].生产力研究,2002.
[2]李瑛珊.对统计工作改革的几点思考[j].统计与决策2003.
[3]刘颖.李新.企业统计在新经济中的改革[j].科技信息.2007.
[4]卢蓉.我国企业统计工作中存在的问题与对策研究[j].现代商业.2009.
[5]周四军,刘颖.论统计技术的创新与实现.统计与信息论坛,2003-07-10.
[6]毛春元.统计技术在质量管理中应用的再认识.江苏省现场统计研究会第11次学术年会论文集,2008-10-17.
[7]肖文渊,陶正纲,张文丽.统计技术在饲料质量管理中的应用.西昌学院学报(自然科版), 2005-06-30.
[8]肖文渊,吴成茂,罗俊春.统计技术在饲料质量管理中的应用.饲料研究,2005-05-10.
关键词:国内物流货运量;灰色预测模型;有效性;合理性
中图分类号:U294 文献标识码:A
Abstract: Due to the large number of influencing factors of logistics freight in the whole country, the data is relatively large and the statistical process is more complicated. Therefore, there is a situation that“some information is determined and some information is uncertain”, and the gray forecasting model can be used to forecast the domestic logistics. This paper establishes the grey prediction model, analyzes whether the gray forecasting model is effective for the forecasting of domestic logistics and the rational use of the model, and forecasts the future domestic freight volume under the premise that the model is reasonable and the result is effective.
Key words: domestic logistics volume; gray forecasting model; effectiveness; rationality
物流是一个复杂的经济现象,物流与经济之间存在双向因果关系(即互动关系)的可能,一方面物流发展推动经济增长,另一方面经济增长拉动物流发展。具体显示物流发展的一个因素是物流货运量,一个区域或一个范围物流货运量的多少,可以说明这个地区物流的发展情况,同时还影响这个区域或这个范围的经济发展情况。
按空间范围来划分,物流活动可分为地区物流、国内物流与国际物流。国内物流是指在一个国家领地范围之内进行的物流活动,国内物流是一个国家经济发展的重要部分。在国内,物流货运方式一共有四种,是公路、水路、民航和铁路。随着经济的快速发展,国内物流也迅速发展起来,原来主要由铁路运输,现在发展为公路、水路、民航和铁路四种运输方式,就现有数据来看每年的国内物流货运量都有所增加,但是由于在全国范围内对物流货运量的影响因素众多,数据较为庞大,统计过程较为复杂,所以存在“部分信息确定,部分信息不确定”的情况,于是便可用灰色预测模型对国内物流货运量进行预测。通过灰色预测模型所预测的结果,可以分析该灰色预测模型对国内物流货运量预测是否有效,模型运用是否合理。同时在模型运用合理结果有效的前提下,可以对未来的国内物流货运量进行预测。
1 国内物流货运量预测模型建立
1.1 灰色预测模型――GM1,1模型
中国学者邓聚龙教授把一般系统论、信息论、控制论相结合,把它们的观点、研究方法延伸到社会、经济和生态等抽象、复杂系统,在19世纪80年代创立发展起来运用数学方法解决灰色系统的理论和方法――灰色系统理论。灰色预测模型是灰色系统理论内容中的一部分,应用广泛,对数据没有强烈的限制,精度高技术简便。
GM1,1模型则表示灰色预测模型是一阶的,同时变量为一个,微分方程表示为■+ax=u。
1.2 GM1,1模型建模过程
首先假设除了研究变量外其他因素每年变化都较小,对所研究问题影响甚微,不考虑在内。
2 国内物流货运量预测
2.1 国内物流货运量预测模型的确立
近年来,物流业迅速发展,国内物流的货运量是呈上升趋势,于是可以对国内物流货运量量化研究,同时国内物流货运量数据是可获得的,同样的,经济的迅速发展,国内实际GDP是呈上升趋势的,于是也可以对国内实际GDP进行量化研究,同时国内实际GDP的数据是可获得的。通过官方平台获得两组实际数据如表1所示。经过对比分析,国内实际GDP逐年增长,国内物流货运量逐年增长,国内实际GDP与国内物流货运量二者之间相互促进。由于数据的真实性,便可运用灰色预测模型来预测未来几年国内物流的货运量及其变化。
2.2 国内物流货运量预测模型及检验
3 国内物流货运量预测模型应用
3.1 未来预测
基于GM1,1的有效性,可对国内2016~2018年的物流货运量进行预测如表3所示:
3.2 结 论
通过上述建模过程、分析得到以下结论:(1)GM1,1模型对研究物流货运量是有效的。(2)从GM1,1模型对国内物流货运量预测结果来看,预测有效,模型运用合理。在实际应用中,可以根据实际情况及需要进行修改,来提高预测值的准确性。(3)根据表3实际预测数值,可以看出,国内物流货运量是呈上升趋势的,中国物流业还会呈现快速增长模式。
基于灰色预测模型的实际应用,根据以上对国内物流货运量预测与研究,可以看出国内物流货运量成逐年增长的趋势,同时国内实际GDP也呈现增长趋势,说明物流的发展对中国经济发展有一定的推动作用。基于灰色预测模型在预测国内物流货运量运用时的合理性,对于未来三年国内物流货运量进行预测,且预测值呈增长趋势,起到对经济发展的推动作用。而且自十以来,我国对经济体制改革不断深入,其根本目的是推动经济发展,为物流业的发展提供更加有利的条件。
参考文献:
[1] 刘南,李燕. 现代物流与经济增长的关系研究――基于浙江省的实证分析[J]. 管理工程学报,2007,21(1):151-154.
[2] 芦阳. 对中国发展第三方物流的分析[J]. 华北水利水电大学学报(社会科学版),2005,21(2):68-70.
[3] 邓聚龙. 灰预测与灰决策[M]. 武汉:华中科技大学出版社,2002.
[4] 崔立志. 灰色预测技术及其应用研究[D]. 南京:南京航空航天大学(博士学位论文),2010.
与传统思路相反
在信息论中的―个重要理论是香农,奈奎斯特(Shannon/Nyquist)采样定理,它认为,无错误地重建―个信号所需的样本数是由带宽决定的(带宽是指信号所占据频谱的最短间隔长度),也就是说为了采集IM的信息,我们至少需要2M的带宽,这被称为奈奎斯特率(Nyquist rate),否则会导致信息失真。
“压缩感知”理论与传统的思路相反,它认为,为什么不事先利用较少的采样数据,在事后再利用最优化的方法反向重建出原始信息呢?
这样的思路也有道理。信号通常是有规律可循的(如果没有规律,完全随机的信号实际上毫无意义,就像电视机屏幕上的雪花噪声),有规律则可以压缩,而可压缩信号的采样频率会大大低于奈奎斯特率,复原后的信息也不会造成失真,这样,我们可以极大地降低对数据处理的要求。
意外中的发现
和很多科学突破一样,压缩感知的发现也纯属意外。2004年,加州理工学院教授Emmanuel Candes在计算机上测试图像算法,他所测试的图像质量很差,有很多雪花一样的噪点,他认为一个名叫LI―minimization的算法能清理掉噪点中的条纹。当他输入指令,让算法开始工作时,奇迹发生了:和预料中一样,图像变干净了但同时他又意外地发现图像细节竟然变得完美起来,这种感觉简直像魔术一样不真实,就如同一位美女只告诉了你她的手机号码中的3个尾数,你却一下子猜对了其余8个数!Candes在不同的图像上重复进行测试,每次的结果都很完美。
Candes又在博士后助理Juscin Romberg的帮助下,提出了一个粗略的理论去破译这个“魔术”,并在黑板上展示给加州大学洛杉矶分校的同事陶哲轩看。他们交谈后,Candes认为陶哲轩可能不太信服他的这项发现,因为从一幅本就糟糕的图得到一个清晰度极大改善的图,几乎是不可能的。然而,第二天晚上,陶哲轩就对这一发现给出了一个更完整的理论解释,两人后来合作了多篇压缩感知的重要论文。
“压缩感知”的巨大潜力让它很快成为研究大热门,接下来的短短6年中,“压缩感知”领域迅速产生了上千篇论文。
运用“公式”来重建图片
压缩感知的工作原理可以用如何得到一幅图像来解释。比如你拿到一张长宽均为1024像素的照片,它的图像由100万像素组成,像素作为最基本单元,其本质就是信号采样。对于100万像素的图像,传统的成像方式便是进行100万次测量,但压缩感知的方式,是只需要测量很小一部分,比如随机从照片不同位置挑选10万个像素,然后通过后期处理补上另外的90万个像素。
要实现这点,依赖于名叫“稀疏”的数学概念。稀疏是用来描述图像复杂性的一种方式。比如我们拍摄飘着自云的天空,其中便有着大片的蓝色和白色,而且这两种色彩远远多于其他色彩,我们可以说,这是一张“稀疏”的照片。
Emmanuel Candes和陶哲轩也发现,一幅图像可以用少量的色块表示。比如我们所拍摄的蓝天白云,图像中有大块的单色,假如这个单色块有300 x 300像素那么大,那么在拍摄时我们可以只需要记录块的维度、坐标和颜色,而不必去记录每一个像素。当重建时再按照维度、坐标和颜色的“公式”便可真实还原出照片。如果是五颜六色的图像,我们只需要将色块缩小到人眼无法识别差异的程度,照样可以用此方法。也许你会觉得,将一个不完整的图像重建成完整图像一定会产生误差,但Candes和陶哲轩却用数学证明了,采用这种方式,图像发生错误的可能性趋近于零!
拯救了孩子的实验性算法
在大众消费领域,由于硬件价格的不断跳水,数码相机压缩不压缩照片对普通用户没有太大的影响。但在更多需要大量数据集的地方,比如核磁共振成像、天文望远镜、统计信号处理、机器学习、生物计算、高光谱成像、表面计量、光谱分析、机器人和控制等领域,“压缩感知”的作用不可限量。
比如核磁共振成像(MRI),通常需要15到~40分钟的扫描,它使用强磁场和电磁波,通过识别水分子中氢原子信号的分布来推测水分子在人体内的分布,进而探测和捕获器官组织的清晰图像。扫描是一个痛苦的过程,儿童需要全身麻醉。扫描的时间越长,对儿童可能造成的伤害几率也越高。根据《连线》杂志报道,去年春天,斯坦福大学儿童医院对一位2岁的婴儿进行测扫描,他的肝脏有缺陷,在移植了捐赠的肝脏后一度好转,但不久又出现恶化。医生需要对肝脏组织进行扫描以诊断哪里出了问题。为了获得高清晰度的扫描图像,医生需要他始终保持平静,否则呼吸会导致图像模糊。操作MRI机器的医生需要花2分钟时间完成扫描。但让脆弱的孩子停止呼吸如此长时间,最后恐怕就不止是肝脏会出问题了。所幸当时这台MRI机器采用了一套实验性的“压缩感知”算法,让医生只需40秒时间完成扫描。当天晚些时候,“压缩感知”重建的图像让医生发现是孩子的胆管出现了堵塞,清理堵塞处后,肝脏便恢复了正常工作。
不仅仅是用于造成图像
[论文关键词]管理科学方法 管理课程 教学 渗透
一、引言
管理课程在实际教学中,可以融入各门学科的基础知识,可以穿插大量实践案例,更可以渗透管理科学中的方法,以实现管理课程综合性、实践性和创新性的特征。管理科学的研究方法吸收和移植了当代自然科学和社会科学的前沿理论,其方法体系具有开放性和包容性的显著特点。因此,管理课程中能够并且也需要管理科学方法的关联教学,能够丰富管理课程内容,增强软学科的硬道理,对于工科类学生的管理课学习尤其重要,能够成为其学习软科学的方法及理论的启蒙教学工具,让其明白管理的科学性及系统性;另方面,管理科学方法随时可能也需要吸收新知识新理论加入,随时可能在其内部形成新的独立单元,将管理科学方法在管理课程中进行渗透,能够使其方法理论结合更多的管理实务,使其在管理现实世界中得到更多的运用,从而进一步的完善和丰富管理科学的研究方法。
另外。我国企业管理水平的有待提高加之我国管理科学教学中存在理论与实际分离的情况导致了管理科学及其方法在实际管理工作中未能得到广泛应用。在管理科学课程的开设和教学中,往往将管理课程与方法课程分开设置,而方法教学中,又过于强调数学问题,如公式推导等,而对管理科学思想,如何从实际问题搜集资料数据建立模型的技术,量化方法与实际管理问题有何关系如何应用等问题分析讲解引导不够。这使得从事实际管理工作的人员对管理科学的方法运用无从下手,将管理科学看成深奥的、难以掌握的、抽象的数学问题,因此,管理科学及其方法难以在管理实践中进行普及。
如果在管理课程的讲授中,面向实际问题,运用关联,归纳演绎等方法将管理科学方法串联或并联至相关管理理论知识中,既能让学习者更好、更全面、更系统的掌握管理知识,又能让他们更好的理解并掌握管理科学的理论与方法,并将其运用于管理工作的实践中,更好的促进了管理科学与管理实践的有机结合。基于此目的,本文从管理科学的主要方法及其特征八手,探讨其在管理课程中如何进行渗透教学。
二、管理科学方法能够渗透至管理课程中的原因及优势
管理科学基本研究方法有三种:归纳法、实验法和演绎法;经过各其他学科的发展,管理科学吸收了各学科的理论和方法,如“老三论”:系统论、信息论和控制论,“新三论”:耗散结构理论。协同论,突变论等。管理科学的研究方法具有多学科移植性的特点.主要依靠不断吸收和移植当代自然科学和其他社会科学的前沿理论作为自己的研究方法。这种移植性进一步决定了管理科学方法的开放性与包容性,使其能够更好的结合管理实际问题得到进一步研究应用与丰富。因此,如何在管理课程教学中渗透管理科学方法。从而让学习者更加明白管理科学方法在管理实践中的价值,使得管理科学方法得到更广泛的应用是值得我们思考和探讨的重要问题。
管理科学研究方法之所以能够融入渗透至管理课程教学中的原因主要有两点:第一,管理活动自身性质原因。任何一项管理活动都是在一定的外部环境和内部环境下产生和进行的,受到包括政治、法律、经济、社会、心理、历史、文化等各种环境因素的影响,这就决定了各项复杂管理问题必须通过运用各学科的知识和方法进行定性与定量分析才能解决,而管理科学方法恰恰是吸收、移植和集合了各个学科的前沿理论作为研究方法。因此,在管理课程教学过程中,理所应当结合实际经验将管理问题与管理科学方法结合起来进行讲解。既传授了管理科学新方法,又让学习者更容易理解并弄清楚管理问题。第二,从事管理教学与研究的教师为在管理课程中穿插与渗透管理科学方法提供了可能性。从事管理教学研究的教师、学者、专家都普遍系统学习研究过管理科学方法,在管理课程授课过程中,能够将自身知识加以融合并结合管理问题进行讲解,因此为在管理课程讲授中穿插和关联管理科学方法提供了必要条件。
结合管理科学方法在管理课程中进行渗透教学,优势是很明显的:
第一,通过将管理科学方法与管理课程中的管理问题进行结合讲解与授课,能够让同学们对管理问题的理解更加深刻,把握更加全面,并且学会对各种实际管理问题的操作思路和运作技巧。使学生所获得的不仅仅是“术”,而且是可以提高到科学高度的“学”。
第二,通过管理课程中管理实际问题能够概括抽象地关联传授和渗透管理科学的很多方法,如系统论、自组织论、信息论等方法,能够帮助同学们学会分析各种管理问题的思路和框架,运用各种观点与方法分析与解决管理问题。
第三,无论是在课堂的教学中还是在管理的研究中,都促进了科学管理和人文管理的不断融合。这顺应了将以“科学主义”为特征的,偏向于“物”,侧重于对外在对象客观描述与分析的科学管理方法与以“人文主义”为特征,偏向于“人”,侧重于对人主观感受与体验的描述与阐释的人文管理这两种模式深化与融合的趋势.
三、管理课程中如何进行渗透管理科学方法的教学
管理科学及方法相关课程在长期的教和学中存在诸如忽略管理特色,教、学、用脱节,教材不适,与现实联系不紧密等问题,导致了管理科学及方法作为独立课程设置后,教学效果不佳,学生没有提问、学习并解决问题的热情和能力,学生不知道如何运用管理科学的方法解决管理中的实际问题等一系列教学效果低下等问题。那么,如何才能够既让同学们学习了管理科学及方法,又让同学们了解其在管理中的运用及效用,并且让同学们有积极性有热情去进一步探索管理科学方法在实际管理世界中解决管理问题的方法途径与模式呢?在任何一门管理课程中,如管理学原理,基础,市场营销学,人力资源管理,企业战略管理,组织行为学,物流管理,供应链管理,生产运作管理,财务管理等管理分支课程中,都可以关联、穿插、渗透相关的管理科学方法进行结合实际管理问题的教学颇为一种更好的管理科学及方法的教学方法及模式。
关键词:信息;信息科学;信息哲学
中图分类号:N031 文献标识码:A 文章编号:16738268(2012)01005806
太阳在照耀,鸟儿在歌唱,书本在招手,电报嘀嗒响……这一切都是不同种类和形式的信息。信息概念的含义极为广泛和深刻,可以从不同的角度和层次对之进行探讨:可作通信技术上的考察;可作经济学、社会学、语言学方面的考察;可作神经学、心理学、遗传学方面的考察;可作系统科学和哲学方面的考察。
自从维纳的控制论及申农的信息论发表以来,信息的概念已具有全新的含义,它既不同于日常生活中所理解的“消息”、“报道”、“音信”等意义,也不同于实用科学从语法、语义、语用或信源、信道和信宿角度给出的信息定义。那么,什么是信息?它的本质是什么?哲学上如何解释?人们从不同领域、不同角度给出的信息定义和概念论述不下百种,但仍然存在很大差异甚至相互矛盾,并且不断还有人提出新的观点和看法,长期争论本身也说明信息概念的深刻性和复杂性。因此,在中国科学院编写的《21世纪100个交叉科学难题》一书中,已把“信息是什么”列为这100个难题之一。
分析已有的众多解释,起码可以区分出三个不同层次的对信息概念的规定:一是人们日常经验理解的层次;二是实用信息科学的层次;三是哲学的层次。
一、日常经验理解的信息概念
在人们的日常生活中,在一般的资料文件中,信息指的就是具有新内容、新知识的消息、新闻、情报、资料、数据、图像、密码以及语言、文字等所揭示或反映着的内容。如果将上述定义中的“消息”作广义化的理解,将所有其他形式的信息载体都看作是“消息”,那么,上述定义的真实含义便是:信息乃是消息中的新内容。显然,这一理解是在消息能否给接收者带来新内容的意义上被规定的。这种对信息概念的日常经验性的理解,显然具有相对性和功能性。此类规定并不能作为信息是什么的本质性解释。
据《辞源》解释,信息就是“消息”。早在唐代李中的《碧云集・暮春怀故人》一诗中,就有“梦断美人沉信息,目穿长路倚楼台”的句子,距今已有千余年的历史。如果把西汉扬雄《太玄经》中的“阳气极于上,阴信萌乎下”中的“信”也作为信息理解,它的历史还要古老得多。 “信息”这个古老的字眼频繁地出现在我们的报刊、文件、广播、电视之中,信息时代、信息社会、信息经济、信息资源、信息技术以及冠以各个专门名词的信息(如商品信息、市场信息、人才信息、科研信息等等)成了热门话题。在信息论看来,信息现象充满天地之间,我们面临的是一个以声音、形态、色彩、气息、电波、光线、元素等构成的大千信息世界;在自然世界与人类社会、无机物与有机物、生命现象与非生命现象中间,都存在着信息的发射、传播与接收的过程。人类早已发现,蜜蜂会用不同舞姿向同伴们表示蜜源的方位,蚂蚁发现了需要用集体力量搬运的食物,会用触角相互传递这一信息,而“鹦其鸣矣,求其友声”证明鸟族是可以用鸟语呼朋引类的,等等。即便是一块不声不响的岩石,也向人们传递着丰富的史前时期地球物理信息。
我国古代相传有两句诗说道:“花如解语应多事,石不能言最可人。” 但从现在看来,石头和花卉虽没有声音的语言,却有它们自己的一套结构组织来表达它们的本质。自然科学家的任务就在于了解这种本质,使石头和花卉能说出宇宙的秘密。而且到现在,自然科学家已经成功地做出了不少工作。以石头而论,譬如化学家以同位素的方法,使岩石能表白自己的年龄;地球物理学家以地震波的方法,使岩石能表白自己离开地球表面的深度;地质学家和古生物学家以地层学的方法,初步地摸清了地球表面即地壳里三四十亿年以来的石头历史。何况花卉是有生命的东西,它的语言更生动、更活泼……像贾思勰在《齐民要术》里所指出的那样,杏花开了,好像它传语农民赶快耕土;桃花开了,好像它暗示农民赶快种谷子。春末夏初布谷鸟来了,我们农民知道它讲的是什么话:“阿公阿婆,割麦播禾。”从这一角度看来,花香鸟语同是大自然的语言,重要的是我们要能体会这种暗示,明白这种传语,来理解大自然、改造大自然。
我国著名科学家竺可祯从物候科学的角度对自然世界的信息现象,作了非常生动的令人信服的科学说明。他认为,月、露、风、云、花、鸟都是大自然的一种语言,我们可以从中了解大自然的本质,即自然规律。他还以人的胚胎为例,说明“有机体的细胞是能存贮无数代个体的经验或信息,而分别加以废置、应用或进化的”。“生物细胞的直径一般不超过几十个微米,而生物界亿万年的进化所形成的关于遗传信息的编码、存储和传递的机制即存在于其中。”[1]
社会科学家和自然科学家都普遍认为,“信息”已经远远大于“消息”的外延,成了一个跨学科、跨领域,统摄性极强、包罗范围极广的概念。它可以表现为消息、情报、通知、书信、编码、指令、资料、数据、程序等具体的信息形式,但任何一种具体的信息形式以及这些形式的简单总和,都不足以说明信息的本质。
二、实用信息科学中的信息概念
在一般的实用信息科学中,关于信息的定义是五花八门的。虽然目前的各种定义还并未得到统一和普遍公认,但是有两种说法是最具影响力的,其他一些定义或多或少都可以由这两种说法通过演绎而获得。
(一)信息是消除了的不确定性
这是根据通讯信息论的创立者申农的理论对信息所作的一个规定。其含义是说,通讯前,消息接收者对发送消息的内容存有不确定性的了解,收到消息后,消息接收者原有的不确定性就会部分或全部消除了。所以,信息就是消除了的不确定性。在这里,消除了的不确定性是一个相对意外程度的量,所以有人也说“信息是两次不定性之差”[2]。
信息,当初仅仅是一种通讯系统的模型,随着科学技术的发展以及人对客观事物认识的深化,就逐渐发展成为一种科学思维模式,主体与客体之间、主体内部结构各部分之间,都存在“信源――信道――信宿”的过程,它揭示了一系列互相关联和相互转变的运动形态。而信息理论,正是分析与研究这种互相关联和相互转变的运动形态的科学。当人们越来越自觉地运用信息观点和方法去认识从自然世界到人类社会的各种规律性时,原来仅仅用于通讯系统的“消息即信息”的传统看法就被突破了,通讯系统的这只小水盆,再也容纳不下信息这头庞然大物的鲸鱼。正是在这种情况下,人们需要重新认识信息概念,以便对它作出新的评价,于是信息的定义问题就被提出来了。
信息问题与通讯系统有内在联系,但已经不是纯粹的通讯系统范畴的问题。在研究信息问题时,我们一方面应借鉴通讯应用理论,另一方面又不应局限于通讯应用理论,而要使我们的视野更加广阔些,不然就会削足适履。信息是与“信源――信道――信宿”这一系统过程形影相随的,脱离了这一系统过程,或者只从这一完整过程的某一局部(或信源,或信道,或信宿)去研究信息,都不可能认识信息的本质属性。纵然对某一局部的研究很深刻,仍然会使人有不得要领之感。
从上面的讨论中可以清晰地看到,“信息是消除了的不确定性”这一定义,实际上是从信息对信宿的作用的角度对信息所作的一种相对性的量上的功能性定义。
(二)信息即负熵
控制论的创始人维纳曾集中对信息的负熵含义进行了阐释[3]。在物理学中(与热力学第二定律相关)熵值是标志系统的不确定性程度或混乱度的概念。不确定性的消除就意味着熵值的减少,所以,信息就可以被称为负熵。由此又派生出了“信息是系统组织程度(或有序性、秩序性)的标志”[4]等说法。
“信息是负熵”,能作为信息的定义吗?众所周知,负熵是熵的对偶范畴。而熵这个概念最早是由克劳修斯在对热力学第二定律作定量分析时提出的,他认为在孤立系统中发生的实际过程总使该系统的熵增加,或自然过程朝着熵增加的方向变化。后来,波尔兹曼对熵首先提出了微观解释。科学家们认为,在由大量粒子(原子、分子)所构成的系统中,熵就代表这些粒子之间无规则排列的程度,或者说代表这个系统“乱”的程度。系统越“乱”熵就越大,系统越有秩序熵就越小。普里戈金说:“所谓熵,就是对‘分子无序’的度量。由此,熵增加的定律就是逐步无序的定律。”[5]美国著名的科普作家阿西莫夫说:“我们可以把熵看作是衡量宇宙中存在的无序程度的一个量。”[6]和熵相对的是负熵。明确提出负熵这个概念的是薛定谔。但是在他之前,波尔兹曼在对熵作微观解释时,已经包含有负熵的思想。负熵的含义和熵相反,就是说明系统的有序、组织、进化的程度。那么,负熵和信息又是什么关系?能否说信息就等于负熵?
负熵是个量,而量不等于质。熵是一个量值,和熵相对的负熵同样是个量值。负熵是一个数量概念,这在学术界是公认的。薛定谔说:“‘负熵’……本身是有序的一个量度。”[7]在信息论诞生以后,负熵是作为对信息的一种量度。维纳曾经说过:“信息量……实质上就是负熵。”无论负熵是对有序的量度,还是对信息的量度,反正负熵是个量值。认为信息等于负熵,也就是把信息说成是一个量值。我们知道,任何事物都有质和量两个方面,信息也不例外。在信息论中,研究信息的量确实是非常重要的,但是对信息量的研究不能代替对信息质的探讨。量和质虽然有内在的联系,但并不是互等的。认为信息等于负熵,就是把信息等同于一个量,抹煞了信息的质和量的差别,实际上是用信息的量代替了信息的质。信息的量相等,质不一定相同。信息总要有信息符作为载体才能传达。我们以英文字母作为信息符,对A、E、T三个字母按不同顺序排列,就得到EAT(吃)、TEA(茶)、ATE(吃过了)、ETA(希腊语的第七个字母H、g)、AET和TAE(均无意义)六种不同的排列。排序改变,信息的意义也变,也就是信息的质也变。A、E、T的不同排列,就有不同的质,而如果计算它们的信息量却是相同的。相反,相同的信息,也可能有不同的信息量。同一个信息用不同的信息符来表示,如计算不同信息符的信息量,结果可能不同,所以,不能用信息的量代替信息的质,而信息的定义主要是从质上对信息加以规定,负熵没有揭示信息的本质,因此不能作为信息的定义。
负熵是对有序的量度,负熵又是对信息的量度,按照A=B,B=C,则A=C的逻辑,信息量就等于有序量。如果把量字去掉,则信息等于有序。有序量则是信息的量,有序则是信息的质。许多人就是按照这个逻辑进行思维的,用有序来定义信息,说明信息的本质。信息等于有序吗?为了回答这个问题,必须分析有序的含义。有序有两种不同的含义:第一是泛指世界上万事万物的有序性;第二是特指信息载体的有序性。但无论指哪一种有序性,都不能作为信息的定义。
负熵是指事物的有序,而事物的有序不等于信息。有序是指事物的结构,结构是事物的重要特性,但结构没有概括事物的全部特性。就热力学系统来说,除了说明结构的有序和无序之外,还有温度、体积和压强等许多属性。信息不仅要反映事物的有序,而且还要反映事物的其他属性。把信息的内容局限于事物的有序性,这就难免以偏概全。
信息等于负熵的说法是把信息等于一个量值,这是不合适的。如果把信息等于负熵理解为事物的有序性,这只看到了信息的语义方面,而忽略了信息的语法方面。如果把信息等于负熵理解为信息载体的有序性,这只注意到了信息的语法方面,而忽视了信息的语义方面。这两种观点都是片面的。显而易见,“信息等于负熵”不能作为信息的定义。
三、哲学中的信息概念
为克服实用信息论中对信息概念所作规定的狭隘性,许多科学家和哲学家又试图从哲学角度对信息的本质加以概括,比较有代表性的观点有以下几种。
(一)属性论:把信息简单定义为事物的属性或某种属性 苏联乌尔苏尔、塔拉先柯等学者认为,“信息是一切物质的属性,承认信息的客观性,是唯物主义的”[8]。我国著名的信息学专家钟义信认为,“信息就是事物的存在方式或运动的状态以及这种方式/状态的直接或间接的表述”[9]。黎鸣先生指出,“信息是物质的普遍属性,它表述它所属的物质系统在同任何其它物质系统全面相互作用(或联系)的过程中以质、能波动的形式所呈现的结构和历史”[10]。王平认为,信息是物质的属性的属性[11]。应该说,钟义信、黎鸣、王平等学者都看到了信息的与众不同的独立意义的方面,但是仅仅用“表述”这一概念还不能恰当地说明信息的物质本体上的客观自在的本质的。信息固然是物质的属性,也固然是物质的存在方式,但是仅仅把信息定义为此,是远远不能揭示信息的本质的。因为从唯物本体论出发,任何事物、现象都可以归结为物质及其属性。从这一点出发,人们有理由把信息与相互作用、运动、时间、空间等概念放到同一个并列的位置。但是,事实上,相互作用、运动、时间和空间这样一些物质的属性与物质的信息属性有着质的不同,因此,它们都不能算作本质性的定义,尤其在哲学中,更不符合哲学定义高度抽象性、概括性的要求。
(二)反映论:把信息定义为事物某种具体属性的反映或表征 刘长林把“信息定义为反映出来的属性,要全面地认识信息,必须超出间接方法的限制,同时采取直接的研究方法”[12]。刘伸认为,“信息其本质仍然是物质的一种属性,是反映的一个方面”[13]。肖洪均把“信息仅仅看作与有机体相联系的现象”[14]。他们根据实用信息论往往仅涉及社会、人、生物等领域的情况,认为反映概念大于信息概念。反映只是信息过程的某种抽象描述,任何反映都必须有它的内容,这个内容就是信息,只要有反映就必然有信息。按照列宁的说法,反映不仅在有机界存在,与之相对应,信息也不仅仅与有机界相联系,客观世界中存在着的历史“痕迹”就是无机界信息活动的最好见证。另外,在受体(信宿)未接受(反映)信息之前,信息就客观存在了。所以,信息只可能大于反映,而绝不可能小于反映。对于信息来说,直接性的意义只能从信源自身的质的考察中才能得到,虽然我们必须坚持信息自身的存在方式必然是反映着的。
(三)中介论:信息作为物质与意识的“中介”而存在 有些学者认为信息既非物质又非精神,是独立存在的第三态,是物质与意识的中介。维纳说:“信息就是信息,不是物质也不是能量。”贡泰尔在《机器的意识・控制论的形而上学》一书中提出,“在物质和意识之外,应设定第三种根本的东西,即信息。这第三种根本的东西既不可完全还原为单纯的客观事物,也不可完全还原为单纯的主观事物”[15]。他认为,现实世界存充着独立的三种根本的东西,即物质、意识、信息。克劳斯认为,“决没有三种独立不依的实在因素,也从来没有两种独立不依的实在因素”,并认为信息是由物质成分与意识成分完全按照特殊方式融合起来的特殊新质”[16]。沈致远认为,“信息并不等同于物质或能量,是一个独立概念,反映的是物质系统的某种可能状态。信息起了客观与主观、物质与精神之间的媒介作用”[17]。钟焕懈说:“信息是主观与客观的媒介。”[18]
应该说,物质世界的唯一特性是客观实在性,它存在于人们的意识之外,在自然界、生物界(人类除外)或机器中所进行变换的信息、作为主体与客体媒介的信息,虽然是一种系统相互联系的特殊形式,是一种相互联系的有目的或无目的的反映现象,具有物质和意识相互渗透的“中介”特点,但“中介”仅仅是信息所起的某种作用,并不是全部作用,也不是对信息是什么的界定。信息到底是怎样的一种存在,它与物质和精神之间的关系怎样?我们从上述学者的这些定义中并不能清晰地判明。
(四)物质自身显示的间接存在论
更多的关于信息本质问题的哲学解释还只是停留在与已有的实用信息科学的解释或哲学的已有范畴间的简单比附上。如:把信息解释为“变易度”、“差异量”等等,这是与实用信息论中对信息进行统计度量的方式特征的简单比附;而把信息解释为“时空序列”、“状态”、“组织性”、“有序性”等等,则是把信息与其载体物的分布特性相比附。又如,把信息解释为:“信息是物质的普遍属性”;“信息是物质的存在方式”;“信息是精神实体的特征”;“信息是既非物质也非精神的第三态”;“信息是物质成分和精神成分的特殊融合物”;“信息是运动的外化”;“信息属于物质的相互作用范畴”;等等,则是把信息与已有的传统哲学概念的界说进行简单的比附。在信息本质问题的讨论中,无论是采取与实用信息科学解释的简单比附,还是采取与传统哲学范畴含义上的简单比附的做法都是没有出路的。
西安交通大学邬教授曾在《哲学信息论要略》一文中就信息的本质进行过专门的讨论,从哲学的角度,给信息下了一个本质性的科学的精确的定义:信息是标志间接存在的哲学范畴,它是物质(直接存在)存在方式和状态的自身显示[19]。应该说,信息的这个定义基本上克服了以上诸多信息的哲学定义所存有的局限性。
第一,这条定义没有在实用信息科学的已有解释或哲学的已有范畴间进行简单比附,而是直接从信息自身存在的方式上把信息规定为“间接存在的标志”,这就不仅摆脱了实用信息定义的种种束缚,而且也跳出了以往哲学概念的重围。
第二,间接存在是和直接存在相对的概念,直接存在指的是物质,间接存在指的是信息,这两个概念揭示了信息与物质在存在方式上的本质区别,而世界上所有的事物和现象都可以归入这两类存在的范围。这样意味着除了客观实在的物质世界之外的一切存在都应当归于信息世界。这一信息定义不仅抓住了信息的最为本质的方面,而且也无疑已经将信息的范围扩展到了不能再扩展的极为广泛的领域。
第三,此定义的前后两个分句的表述,都坚持了运用本体描述的直接性方法,坚持了信息本质的唯物论立场。这两个分句实质上是同一个意思。“显示”着的东西必然是“间接存在”的,而“间接存在”的东西又必然是“显示”着的。但是两句话比较起来,前一句话不能不更为抽象,而后一句话则可看成是前一句话内容的具体化。所以,此定义的两个分句都可以分别拿来作为信息的本质规定。
四、结 论
综上所述,人们大量使用、社会广为流行的“信息”原来还是一个说不太明白的概念。概念的产生,本来就是对感觉、知觉、印象这类直观认识形式的抽象,它反映了事物的本质属性,是一种理性认识形态,但现在却需要回过头来对这种抽象的理性认识形态进行再研究。面对这个为人们大量使用、社会广为流行的概念,理论工作者们几乎同时提出了一个相同的问题:“信息究竟是什么?”并且从各个不同的角度对信息提出了各种不同的定义,试图探索一个能说明信息本质属性而又为多数人接受的定义。
无论是人们日常经验理解的信息概念,还是实用信息科学的信息概念,都是对信息进行的具有相对性、功能性和量化性规定特征,都无法科学地给出信息的概念,都不能揭示出信息所具有的普遍性品格的本质和意义。因此,只能从哲学的角度定义信息,目前,科学准确的信息概念是邬教授的“物质自身显示的间接存在论”。正是邬首次将信息概念作为哲学的最基本范畴之一引入哲学,把信息作为一种普遍化的存在形式、认识方式、价值尺度、进化原则来予以探讨,全面系统地建立了包括信息本体论、信息认识论、信息生产论、信息社会论、信息价值论、信息方法论、信息进化论诸多领域的系统化的信息哲学理论体系[20]。他所创立的信息哲学提出了一种关于物质与信息双重存在和双重演化的理论,使信息哲学真正成为一种区别于其他哲学的元哲学或最高哲学,从根本上改变了哲学基本问题的具体表述方式,实现了人类哲学的第一次根本转向,导致了人类哲学的全方位的根本性变革。
参考文献:
[1] 竺可祯.物候学[M].北京:科学出版社,1973:8384.
[2] 申农.通信的数学理论[M].上海:上海科学技术编译馆,1965:134.
[3] 维纳.控制论[M].北京:商务印书馆,1963.
[4] 维纳.人有人的用处:控制论与社会[M].陈步,译.北京:商务印书馆,1978:133136.
[5] 伊雅・普里戈金.生命的热力学[J].摘译,1974(2):2543.
[6] 阿酉莫夫.你知道吗?――现代科学中的一百个问题[J].科学普及,1980(4):145148.
[7] 埃尔温・薛定谔.生命是什么?[M]上海:上海人民出版社,1973:81.
[8] 乌尔苏尔,塔拉先柯.关于控制论中“信息”概念的定义[J].自然辩证法研究通讯,1963(2):3546.
[9] 钟义信.信息科学[J].自然杂志,1979(3):155.
[10] 黎鸣.试论唯物辩证法的拟化形式[J].中国社会科学,1981(3);论信息[J].中国社会科学,1984(4).
[11] 王平.信息概念初探[C]//自然辩证法论文集.北京:人民出版社,1983:5668.
[12] 刘长林.论信息的哲学本性[J].中国社会科学,1985(2):3645.
[13] 刘伸.信息与情报[J].情报科学,1980(4):35.
[14] 肖洪均.信息的本质和认识论[J].哲学研究,1981(8):8996.
[15] 贡泰尔.机器的意识・控制论和形而上学[M].上海:上海人民出版社,1957:3846.
[16] 克劳斯.从哲学看控制论[M].梁志学,译.北京:中国社会科学出版社,1981:6268.
[17] 沈致远.什么叫信息科学[J].人民教育,1980(11):5456.
[18] 钟焕懈.信息与反映[J].哲学研究,1980(12):59.
关键词 信息处理;N元模型;语音识别;句法分析
一、中文信息处理的特点
1.汉字的特殊性
我们都知道,英语在计算机信息处理方面的优势就是其字母数量有限,因而可以很容易的进行输入输出以及信息的加工和处理,而中文的汉字则数量庞大,且字形相对复杂,这就给汉字的编码带来了不小的困扰。因此我们根据汉字信息处理过程中的不同要求对汉字进行了不同形式的编码,总结来说有以下几种方案,即汉字输入编码,汉字标准编码,汉字内码和汉字形码。
2.书面汉语的特殊性
汉语的另一个特征是在书面表达中,词语和记号之间没有明显的分隔标记,这就使自动分词在书面汉语分析中成立一个难题。分词需要将连续的字按照一定的规范进行有序的组合,比较英文我们会发现,英文单词之间都是用空格来做分隔符,而中文则是习惯通过字、整句以及段落进行简单的划分,而这其中的一个难点就是对词语的划分,我们都知道,英语中也有短语划分的问题,但是由于中文的词语远比英语的数量和范围要庞大,因而处理起来更为困难。
3.汉语语音的特殊性
在语音方面,汉语的特征是音节结构相对简单,音节划分界限比较清晰,但是声调和变调是中文与英文的显著区别,因而在语音识别和语音合成方面来讲这是一个劣势,但是总体上来说汉语语音的处理比之其他方面来说还是相对容易的。
4.汉语语法的特殊性
在语法方面,汉语词汇的句法功能相对来说难以判断,这与英语语言上的多变形态有着截然不同的表现。汉语主要依靠词序和虚词来表达不同的含义,因此如果不能很好的掌握句法,就特别容易产生歧义,因此汉语语句自动分析这一重要技术是一项难以攻克的技术。
二、中文信息处理的若干技术
1.N元模型
设wi是文本中的任意一个词,如果已知它在该文本中的前两个词wi-2w-1,便可以用条件概率P(wi|wi-2w-1)来预测wi出现的概率。这就 是统计语言模型的概念。一般来说,如果用变量W代表文本中一个任意的词序列,它由顺序排列的n个词组成,即W=w1w2。。。wn,则统计语言模型就是该 词序列W在文本中出现的概率P(W)。利用概率的乘积公式,P(W)可展开为:P(W)=P(w1)P(w2|w1)P(w3|w1 w2)。。。 P(wn|w1 w2。。。wn-1)不难看出,为了预测词w n的出现概率,必须知道它前面所有词的出现概率。从计算上来看,这种方法太复杂了。如果任 意一个词wi的出现概率只同它前面的两个词有关,问题就可以得到极大的简化。这时的语言模型叫做三元模型(tri- gram):P(W)≈P(w1)P(w2|w1)∏i(i=3,。。。,nP(wi|wi-2w-1) 转贴于 中国论文下载中
符号∏i i=3,…,n P(…)表示概率的连乘。一般来说,N元模型就是假设当前词的出现概率只同它前面的N-1个词有关。重要的是这些概率参数都是可以通过大规模语料库来计算的。比如三元概率有P(wi|wi-2wi-1)≈count(wi-2wi-1wi)/count(wi-2wi-1)式中count(…)表示一个特定词序列在整个语料库中出现的累计次数。
2.语音识别
语音识别的最终目标是使人类与计算机之间实现真正意义上的自由交流,使机器听懂人类的语言,并及时的做出准确的反馈。语音识别技术包括了信号处理、模式 识别、概率论和信息论、发声机原理和听觉原理、人工智能等主要内容。语音识别技术主要包括特征提取技术、模式匹配准则和模型训练技术3个方面,另外还涉及 到语音识别单元的选取,在这个问题上我们通常采用的是以音节为识别单元。另外,在特征参数的提取技术方面,由于语音符号中含有大量的信息,它们通常被称为 声学特征。特征参数是决定语音识别质量的关键技术,因此我们应该极可能的采集所要传播语言的语义信息,剔除掉说话人的个人信息干扰,这样才能保证特征参数 的有效性和准确性。
3.句法分析
句法分析是以汉语的语法特征为分析方法,对句子、段落中的短语结构树进行各个句子成分 关系的分析,分析的主要内容包括:句子中所有的单句,每个单句在句法中的作用是什么,在单句以上更大的语法结构是什么,句子中的短语或词组类型是什么,在 句子中起了什么作用,最后,所有这些成分是如何有机组合或附着在整个句子中的,这些就是句法结构分析的主要内容,这叫做线图分析法。值得说明的是,英语语言结构中主语必须置于谓语之前,否则所表达的意思就完全变化了,当然,在一些特定情况下,如倒装句结构中这种情况还是普遍存在的。这一点是与汉语有着显著的区别的。
三、结语
中文信息处理技术有着重要的意义,它是语言学与信息技术的有机融合,旨在对中文的音、形、义等输入计算机,进而进行必要的信息加工与处理,在这一过程中涉及到了计算机科学、信息学、声学等大量学科的交叉知识。具体来说,语言信息处理是将自然语 言的各个部分,包括词语、句子、段落以至篇章进行文本、声音和图像各种方式的信息化加工,然后对这些信息进行输入输出、压缩、存储以及检索等等各项处理。 我们都知道,自然语言是我们日常最重要的交流沟通工具,是人类进行思维活动、文化传播的有效载体,因此语言信息处理这种技术有着重要的意义,本文专门分析 了利用计算机处理中文信息,即汉语信息处理技术,希望本文能够对同行们有所启示,还望能够多多交流学习,更好的完善这项技术。
参考文献:
关键词 电力线通信;数据压缩;LZW
中图分类号TN913 文献标识码A 文章编号 1674-6708(2011)57-0192-02
电力线载波通信是利用已有的电力线路进行数据传输的一种通信方式,无需专门架设通信基础设施并且具有相当广泛的网络分布,具有投资小、设备简单、通信可靠性高等优点。然而,由于电力线载波通信存在着一些技术难题,如传输信道间歇噪声大、阻抗随负载变化大、信号衰减大等问题,我们将数据压缩技术引入电力线载波通信,在数据传输前进行压缩,这样就可以尽可能在有限的带宽内传输尽可能多的数据。
1 数据压缩原理
数据压缩是指在不丢失信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率的一种技术方法。或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间。压缩的理论基础是信息论[1]。从信息的角度来看,压缩就是去除掉信息中的冗余,即去除掉确定的或可推知的信息,而保留不确定的信息,也就是用一种更接近信息本质的描述来代替原有的冗余的描述,这个本质的东西就是信息量。
关于数据压缩有很多算法,针对不同特点的数据选择不同的压缩算法从而达到最优的压缩效果。LZW继承了LZ77和LZ78压缩效果好、速度快的优点,且算法描述易于接受。该算法能在不了解数据统计特性前提下,使压缩比接近已知统计特性时所能达到的压缩比,且易于实现,是目前最常用的算法。
1.1 LZW算法基本原理
LZW压缩算法是一种新颖的压缩方法,Lemple-Ziv-Welch 三人共同创造,用他们的名字命名。它采用了一种先进的串表压缩,将每个第一次出现的串放在一个串表中,用一个数字来表示串,压缩文件只存贮数字,则不存贮串,从而使图像文件的压缩效率得到较大的提高。奇妙的是,不管是在压缩还是在解压缩的过程中都能正确的建立这个串表,压缩或解压缩完成后,这个串表又被丢弃[2]。
LZW算法中,首先建立一个字符串表,把每一个第一次出现的字符串放入串表中,并用一个数字来表示,这个数字与此字符串在串表中的位置有关,并将这个数字存入压缩文件中,如果这个字符串再次出现时,即可用表示它的数字来代替,并将这个数字存入文件中。压缩完成后将串表丢弃。如"print" 字符串,如果在压缩时用266表示,只要再次出现,均用266表示,并将"print"字符串存入串表中,在图像解码时遇到数字266,即可从串表中查出266所代表的字符串"print",在解压缩时,串表可以根据压缩数据重新生成。
LZW算法流程:
1)初始化:将所有的单字符串放入串表;2)读第一个输入字符给前缀串ω;3)Step: 读下一个输入字符K。
if 没有这样的K(输入已穷尽):
码字(ω) 输出;结束。
If ωK 已存在于串表中:
ω:=ωK;repeat Step;
else ωK不在于串表中:
码字(ω) 输出;
ωK加进串表;
ω:=K;repeat Step.
例子:
input:ababcbababaaaaaaa
ω:a->ab->ba->ab->4c->cb->ba->5b->8a->aa->aa->10a->aa->11a->a#->#
串表:1(a) 2(b) 3(c) 4(ab) 5(ba) 6(4c) 7(cb) 8(5b) 9(8a) 10(aa) 11(10a) 12(11a)
output:a b 4 c 5 8 a 10 11 a
1.2 电力线通信报文压缩算法设计
将LZW压缩算法应用在电力线通信中,数据采样利用率提高了两倍,使报文传递更可靠;通过控制信息位(bit)级检错、数据信息分组检错等手段,增强检错能力,降低误同步概率;数据信息分组检测纠错,报文长度不再受链路层程序逻辑限制;纠错方式不再是唯一的扩频,支持不同长度的扩频编码,速率的提高可减少报文冲突几率,有利于并行路由的顺畅运行;报文压缩后不仅可以提高传输速率,还可以提升数据传输成功机率[3]。
例如,报文原始数据为:255,24,54,255,24,255,255,24,5,123,45,255,24,5,24,54...如何对它进行压缩,因为原始数据可以用8bit来表示,故清除标志Clear=255+1 =256,结束标志为End=256+1=257,目前标号集为0 1 2 3......255 CLEAR END
第一步,读取第一个字符为255,在标记表里面查找,255已经存在,不做处理;
第二步,取第二个字符,此时前缀为A,形成当前的Entry为(255,24),在标记集合不存在,把它在标记集合中标记为258,然后输出前缀A,保留后缀24,并作为下一次的前缀(后缀变前缀);
第三步,取第三个字符为54,当前Entry(24,54),记录(24,54)为标号259,并输出24,后缀变前缀;
第四步:取第四个字符255,Entry=(54,255),记录(54,255)为标号260,输出54,后缀变前缀。.......
一直处理到最后一个字符,用一个表记录处理过程,CLEAR=256,END=257。
表1 LZW算法举例
2 算法改进
2.1 改进思路
LZW方法简单易行,但是存在诸多不足,例如,对不同大小的文件,均使用12位输出代码。在压缩的开始阶段文件较小时,字典中的短语比较少,使用位数更少的压缩代码显然能减少压缩文件的大小[4]。当“next code”的值在256到511之间时,9位输出代码就足以表示所有短语;另一个有待改进的方面是压缩率的监测。在压缩进程中,当字典空间被填满、新的短语不能加入到字典中时,对随后的字典中无定义的字符串就无法进行压缩,压缩率将下降。
2.2 改进方法
1)可变代码长度
发现字典填满时,立即将字典清空,以便后续字符串能建立短语。首先在字典中设置清除标志,当字典填满后,在进行阈值判断时,对每一个码字(Code Word)的使用情况计数。当进行阈值判断所得到的压缩比小于指定的阈值时,发出清除标志,这时根据字典中每一个码字使用的计数值大小进行排序,对字典进行相应的重构,然后删除排序靠后的若干项。这种方法较简单,也有效果[5]。
STEPl初始化,使开始词典包含所有可能的根(Root),当前前缀P置空;
STEP2当码字流有码字要译时,反复执行STEP3,STEP4,STEP5和STEP6;
STEP3读入字符数据流中的下一个字符C;
STEP4如果字符串P+C在当前词典中,
a P置P+C(用字符C扩展P);
b 把代表当前前缀P的码字输出到码字流;
否则,
c 输出表示P的码字到编码数据流;
d 把字符串P+C添加到词典;
e P置C(此时P仅含一个字符C);
STEP5若字典未满,则执行STEP3;
STEP6如果压缩比小于指定阚值,则清除匹配率小的词条,否则,返回STEPl;