时间:2022-03-07 00:19:32
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇数据信息论文,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
关键词:信息论与编码;教学改革;教学方法
中图分类号:G424 文献标志码:A 文章编号:1674-9324(2016)19-0085-02
一、引言
信息论与编码是南通大学电子信息类本科三年级的一门专业必修课,主要是研究信息传输的有效性和可靠性的一门学科[1,2]。该课程是通信技术与概率论、随机过程、数理统计等学科相互融合而发展起来的一门交叉学科[3]。该课程要求学生掌握线性代数、微积分等基本的数学工具,还需要学生对通信原理等课程有较深刻的认识。个人计算机的普及和通信专业软件的日益成熟,使得该课程的实验教学成为可能。可见,该课程理论性强、内容多,与先修课程有密切的关系。针对该课程的变化与最新发展,为了提高教学效果,笔者在理论教学、实验教学、科研联系教学、考核方式等多个方面进行了改革。
二、教材选择
根据学校的层次、专业特点和教学对象选择一本合适的教材是教学改革的一个基本方面。目前,有关信息论与编码这一课程的教材非常多。如王育民编著的《信息论与编码理论》以及Cover著写的《信息论基础》的中译本和英文影印本。随着网络技术的迅猛发展,最近出现了一些新教材,如仇佩亮编著的《多用户信息论》、Yeung编写的《信息论基础》和Gamal编著的《网络信息论》。这些教材的知识体系结构和侧重点各有不同,而且差别很大。根据信息论与编码专业必修课的性质,按照强调基础理论学习,突出对所学理论知识灵活应用的原则,我校选用了曹雪虹主编的《信息论与编码》作为教材。该教材吸收了国内外众多现有教材的精华,注重基本概念,突出基础理论,强调应用。而且,该教材难度适中,文字通俗易懂,用较多的例题和图示阐述了基本概念、基础理论和应用,适合作为我校信息工程和通信工程等专业的教材。
三、课程内容改革
教学内容改革是课程改革的核心。根据我校相关专业的实际教学情况和效果,对信息论与编码教学内容改革有如下的考虑。
(一)注重教学内容的承上启下
教师在该课程教学中,要强调已学专业基础课中的信号与系统、数字信号处理和通信原理,分别解决点对点通信系统中关于信源和信道的一些具体问题,而信息论与编码将从更抽象的层面看待整个通信系统,为通信学科的发展指明了方向。正如著名通信理论家Viterbi所说,如果把现代通信技术比喻成飞船,则晶体管是它的引擎,而信息论是它的方向盘[4]。注重该课程与已学课程融合的同时,还要突出该课程在后续课程学习中的作用,指出该课程是数据压缩技术、语音信号处理、图像处理等课程的理论基础。另外,教学过程中,还要适当介绍信息论的最新进展和研究热点,以激发学生的学习兴趣。
(二)教学内容的模块化
教学过程中,将信息论与编码的教学内容看作一个有机整体,遵循注重结论表述的通俗易懂、突出理论严密和精美的原则,把课程内容分为信息度量、香农三大定理、编码三大块内容。信息度量描述了将抽象信息量化的方法,为学习香农三大定理提供了理论基础。随后,结合学生已学课程,介绍香农三大定理的意义,通俗形象地表述香农三大定理,指出香农三大定理是信源编码和信道编码技术的理论基础。
编码理论包含信源编码和纠错码两大块内容。其中信源编码部分主要包括香农编码、费诺编码、霍夫曼编码、游程编码、算术编码、变换编码等,是香农第一和第三定理的应用。纠错码包含线性分组码、循环码、卷积码、TCM码和Turbo码等,是香农第二定理的经典应用。讲授这部分内容时,主要向学生介绍二元编码,以简代繁,让学生能够快捷掌握实用的编码技术。
(三)融合最新研究成果,突出实践和应用
授课过程中,一方面,注意引导学生用所学到的理论解释先前所学专业基础课的部分经典内容和结论,突出所学课程的应用功能。例如用数据处理不等式解释为什么信号经过处理会丢失部分信息,用限平均功率最大熵定理解释为什么总假设信道噪声是高斯白噪声,用信息论的基本概念导出香农信道容量公式等。另一方面,随着信息和通信技术的进步和发展,在讲课过程中,需要向学生讲授LDPC码、协作通信、MIMO通信系统和网络编码等最新出现的通信和编码技术,以及网络信息论的最新理论成果。
许多高校在讲授信息论与编码这门课时,往往注重理论教学,重视向学生讲解抽象的概念、理论和对重要结论的逻辑推理,而忽略了这门课是理论和实践紧密结合的课程,对实验教学的关注非常有限,学生很难将学到的理论知识与实际相结合[5]。课程改革后,为该课程确定了四个实验,分别是信息熵计算、信道容量计算、霍夫曼编码实验、CRC校验编码实验。
四、教学方式改革
教学方式改革的目的就是要激发学生的学习热情和学习兴趣,让学生成为教学的主体,信息论与编码的教学方式的改革包含以下几个方面。
(一)传统板书与多媒体结合
信息论与编码这一课程的内容多、理论性强,许多结论需严格的推理证明。因此,课程教学中需要把多媒体教学信息量大和传统板书易于展示复杂理论推导、表现力强、便于师生交流的优点相结合。这样,生动形象的多媒体教学保证了课堂的信息量,而严格的推理证明可以让学生深刻理解相关结论,领悟理论的精要,掌握课程的重点和难点。
(二)内容讲述形象化,逻辑推理严格化
信息论与编码是运用数学工具解决通信中问题的典范。课改过程中,讲授该课程时,做到语言通俗易懂;表述重要结论时,尽量形象生动。例如,讲授香农第二定理时,先指出香农第二定理所给出的结论是信息传输是否出错,取决于信道容量和信息率之间的关系,而不是数据传输的次数,这和人们直观认识不一样。在学生对香农第二定理有了感性认识后,给出香农第二定理严格的推理证明,让学生感受理论的严密和精美。
(三)灵活运用多种教学方法
综合运用多种教学方法,不仅能将理论知识融会贯通,而且可以引导学生进行主动的探究性学习,还可以引导学生主动思考,积极参加讨论,提高学习效率及综合运用所学知识解决实际问题的能力[6]。
在信息论与编码课程改革过程中,笔者根据学生所在系别和专业的不同,综合运用案例式教学、研究型教学、启发式教学、演示练习式教学、互动讨论教学等多种教学方法,将这些教学方法贯穿于该课程教学的始终。并在该课程教学中引入实验教学,使用Matlab仿真软件搭建通信系统模型,实现理论和实践的有机结合。
五、课程考核方式改革
课程改革后,采用的考核方式比传统考核方式更加全面、细致、科学。学生的成绩将由平时作业、课堂练习、学习报告、课堂讨论发言、实验和期末考试几个部分组成。
布置适量的课后作业可以让学生及时巩固所学知识,深化对基本概念和基本理论的理解,掌握解决问题的基本方法,提升学生解决问题的能力。同时,能激发学生探索发现解决问题的方法,通过一题多解、一题巧解能够把学生的发散性思维和聚敛思维结合起来。
针对课程的典型例题和解决问题的典型方法,教学过程中进行精讲和演示,尔后选择合适的习题,让学生做课堂小测试。这种小测试是根据“90后”学生喜欢看手机、注意力容易分散的特点设计的,小测试可提高学生的注意力,增强教师对课堂气氛的调动和掌控,同时可让学生及时巩固所学理论和方法。
要求学生组成3~4人的学习小组,围绕与该课程紧密相关的抽象概念、基本理论展开讨论,让学生经过讨论对课程有更全面的认识。每个学习小组的学生一起完成实验,并选择和该课程密切相关的科研课题,阅读与所选课题密切相关的书籍和论文,合作书写一份不少于3000字的手写报告,要求参考文献不少于10篇。
该课程最终需要闭卷考试,教学改革后,我们更新了题库的部分题目,增加了近年来出现的新题型。同时,各任课教师统一了考试要点,重点检测学生对核心内容的理解和掌握,避免了偏题和怪题的出现,有效检验了学生对课程内容掌握情况,真实反映了学生对课程的理解程度。
六、结语
该文分析了信息论与编码课程最新的发展和变化趋势,根据课程组各位任课教师多年的教学心得,对课程进行了教学改革,因地制宜地调整了教学大纲,重新对课程教学进行了整体设计,优化了教学内容,增加了实验教学环节,综合运用多种教学方法,提高课程的趣味性和应用性,促使学生积极、主动地学习该课程。
参考文献:
[1]曹雪虹,张宗橙.信息论与编码[M].北京:清华大学出版社,2009.
[2]Cover M Thomas,Joy A Thomas. Elements of Information Theory[M].北京:清华大学出版社,2007.
[3]谢正光,包志华,章国安.概率统计在信息论与编码教学中的应用[J].南通大学学报,2008,25(4):88-90.
[4]仇佩亮.信息论与编码[M].北京:高等教育出版社,2011.
[关键词]图像压缩;图像编码;压缩标准
中图分类号:Tp311 文献标识码:A 文章编号:1009-914X(2014)45-0358-01
0 引言
当今社会正处于高速发展的信息时代,而信息本身就需要进行存储、图像信息是人类认识世界和感知世界的重要源泉。图像具有确切性、直观性、高效性、时空性等特征,图像信息的这些特性导致它的数据量特别庞大。图像压缩就是对数值矩阵进行处理,用相对少的数据来表示这个数值矩阵。这个过程要在图像数据存储、处理和传输之前进行,在这之后要对压缩过的图像进行解压缩来重建图像,这就是图像压缩和解压缩,也称图像编码和图像解码。
1 图像压缩的原理
从信息论的观点来看,图像作为一个信源,描述信源的数据是信息量和信息冗余量之和。所以在图像数据的表示中存在着大量的冗余,如时间冗余、空间冗余、知识冗余、视觉冗余等,可以利用图像本身的一些特点和人眼的视觉特性,去除这些冗余数据就可以使原始图像数据量极大的减少,从而解决图像数据量庞大的问题,实现图像数据压缩。
2 经典图像编码
2.1 变换编码
很多图像编码的原理是通过消除图像的冗余度来达到压缩的目的,而变换编码则是改变了冗余度的表达方法,将原始数据用另一种更加紧凑的方法表示,有时可以实现更高的数据压缩。离散余弦变换(DCT)即是一种分形变换编码。DTC的出色之处是能将大部分图像分成像块,使像块的能量集中到少数低频DTC系数上,这样一来DCT可以将图像的能量很大程度的集中在一起,为压缩打下了基础。
2.2 嫡编码
嫡编码的原理是根据消息或消息序列出现概率的分布特性来寻找概率和码字长度间的最优匹配。游程编码、霍夫曼编码和算术编码等都是目前使用较多的嫡编码。
3 现代图像编码
现代图像编码和经典图像编码的区别之处在于它不是像经典图像编码那样尽量去除图像的相关性,而是利用图像的相关性进行编码。
3.1 分形编码
分形编码是一种直接在空间域寻找并最大限度地利用图像的自相似性的编码方法。
3.2 模型基图像编码
模型基图像编码主要是利用图像的区域、轮廓等二维特征以及形状、运动轨迹等三维特征进行建模,然后对图像和模型进行分析得出模型的各种参数,再对参数进行编码传输,解码端则由图像综合恢复出图像。这种编码方式可以实现较高的压缩比,图像的恢复质量也有了大大的提高。
3.3 小波变换技术
小波变换理论是新的数学分支,其基本思想是将原始图像通过一族小波函数转换为小波域的系数,再通过略去某一阈值下的系数,保留部分原始能量保留较多的系数来压缩图像。在小波变换中,图像被分解为不同空间、不同频率的子图像,一幅图像每经过一次小波变换,图像就被分解为四幅大小为原来的四分之一的小块频带区域,再将这四幅子图针对人的视觉特点分别进行不同的编码处理,可以得到比较高的压缩比和好的压缩质量。
4 图像压缩的分类
图像压缩一般根据图像数据是否有丢失分为有损压缩和无损压缩两类,无损压缩是理想的压缩方法(无信息丢失),也称可逆压缩。有损压缩也称不可逆压缩,经过有损压缩后,重建图像中像素的值和原始图像中对应的像素的值不完全相等,图像会发生畸变。
图像无损压缩编码方法可分为两大类:基于统计概率的算法和基于字典技术的算法。基于统计概率的算法是根据信息论中的变长编码定理和信息嫡的相关知识,用较短的代码代表出现概率大的符号,用较长代码代表出现概率小的符号,从而实现数据压缩。而基于字典技术生成的文件包含的是定长编码,每个码代表原文件中的一个特定序列。
和无损压缩不同的是,有损压缩编码在图像进行解码还原之后的准确度上要求没有那个高,因此会产生一定程度上的失真,但这种编码方式可以提高图像的压缩能力。一般情况下,这种失真人眼看起来可能会比较明显,也可能不明显,不管是哪种,只要在人眼的容忍范围之内,就说明这种压缩时可行的。
5 图像压缩标准
随着图像处理技术的发展,研究人员提出了多种图像压缩标准。常用的图像压缩标准分为静止图像压缩标准和视频图像压缩标准。
目前最常用的静止图像压缩标准是JPEG图像压缩标准。JPEG标准定义基于DCT得有损基本编码系统、面向大规模压缩得扩展的编码系统和面向可逆压缩的无损独立编码系统。JPEG具有有失真和无失真两种编码解码的处理方式,其中无失真得到的解码后图像和原图像数据基本相同,但压缩率较低,而有失真可以实现高的压缩比,但同时可能会导致图像的失真较明显。压缩比的高低可以在算法中改变压缩参数来调整。JPEG标准的计算量不算很大,算法也易于实现,所以具有较好的实用性能。
随着多媒体技术的快速发展和广泛应用,为满足用户对更高压缩效率和对压缩图像的互动性和可伸缩性的要求,JPEG2000应运而生的。
JPEG2000标准可以实现很高的压缩性能,它还具有只对感兴趣区域编码、可进行有损压缩和无损压缩、对错误的鲁棒性、对码流做随机访问等特性。灵活使用这些特征,不仅可以达到很高的压缩比,还可以满足在移动和网络环境下交互操作和可伸缩性的要求。JPEG2000的需求针对性以及技术先进性保证了它光明的应用前景。
6 图像压缩性能的评价
一个图像压缩方法性能的评价主要从两个方面来衡量:压缩比和图像质量评价。压缩比就是原始图像文件大小与压缩后生成文件大小的比值,比值越大,说明压缩率越高。图像质量评价一般是通过保真度准则来判断。保真度准则有两种:客观保真度准则和主观保真度准则。
6.1 客观保真度准则
客观保真度准则是对解码图像和原始图像的误差进行定量计算的一种衡量标准,一般是对整个图像或者图像中的某个指定区域进行某种平均计算得到均方误差。
6.2 主观保真度准则
图像经压缩编码和解码还原之后,图像质量的好坏还有一个直接的评价者就是人眼,因此人的主观印象也是衡量一个图像压缩编码的重要因素。主观保真度准则的实施过程是选定若干评价者对待评图像打分,对这些分数求个平均值可以得到主观评价分。但因为个体评价会受到个人喜好、光线、距离等因素的影响,很难对其制定一个统一的标准,所以图像的主观质量评价方法受到了一定的限制。
参考文献
[1] 张伟.基于小波变换的图像压缩系统研究[D].厦门大学硕士论文.2005.2.
[2] 向辉.基于小波理论的图像压缩算法研究[D].华东师范大学硕士论文.2006.7.
[3] 张跃飞.基于稀疏分解的图像压缩[D].西南交通大学硕士论文.2006.9.
[4] 雷萌.数据压缩算法的比较研究[J].2014.11.
注:基金项目:2012年民族学院校内项目“基于哈希表的数据压缩算法研究”,项目编号:12myZ05
作者简介
【关键词】正交频分复用(OFDM)多径干扰噪音降解
一、OFDM的简单介绍
OFDM是正交频分复用技术(Orthogonal Frequency Division Multiplexing)的缩写,OFDM是基于多路载波的新型信号调制传输技术,具体是将信号数据分解成多个相互独立的子信号流,各子信号流将以相对低很多的流量传输,多个子信号流以较低流量并行传输是OFDM的典型特征,相对于传统的单载波系统,多载波模式可以大幅度扩展信道容量。上世纪60年代,关于多载波调制传输技术的理论工作就已经展开,通信技术专家论证了尽管多载波传输存在信号干扰,但仍可大幅度优化信息传输系统的性能。七零年代初,OFDM首次被已专利形式确定下来,1971年Weinstein和Ebert采用离散傅氏变换实现了多载波调制,该方法发表在了IEEE杂志上,之后的十多年内,虽然人们深入研究了如何在移动通信领域运用多载波调制技术,但由于当时数字信号处理技术及高效信号调制技术没有跟上,多载波传输技术并没有被广泛应用。这一情况直到上世纪九十年代才被改观,从此OFDM技术受到重视并被广泛应用开来。
OFDM技术相对于传统的单载波系统,虽然有效地扩展了信道容量,但多径传播各路信号难以事先关联,不可避免出现子信道信号相互干扰,如何消除各种干扰称为噪音降解。
二、噪信降解准备之离散多音频(DMT)技术
OFDM最先采用频率不同的子路载波传输单个高容量信息流,而不是分别用各路径传输相异子信息流,那种情况下,发射端采用并行发射,单一信道内可将此种并行发射传送技术与单载波高容量串行传送进行比较,若简单借助多组发射机和接收机来实现,成本会非常高,后来人们实现了将9点的QAM调制技术应用于多载波调制系统上,接收端使用子信道相关性检测,子载波间的频率间距取决于码元编解速率,使频谱利用率达到了优化。
离散傅氏变换技术是将输入信号分组,使各组数据包含n个复数码元,每组的一个复数码元占用一个子信道,接收端先对输入信号取样,然后对每组数据实施离散傅里叶变换,复原原信号。这种模式的OFDM称为DMT,即离散多音频,DMT技术主要优势是基于FFT算法的优越性,理论上讲,n码元FFT仅耗用nlogn次乘法运算,直接采用DFT所需的运算为n2量级。
近20年来,OFDM技术,特别是DMT技术,已经被广泛运用到各种通信技术中,如今,DMT已被用作ADSL的标准技术。
三、多载波信道噪音降解
OFDM技术配合适当的编码技术及交织技术,可有效抵抗无线信道的干扰,在无线通信高速传输技术中,频率响应曲线一般不是平坦的,OFDM的主要想法是将给定信道在频域内分解成相互正交的子信道,每个子信道用一个子载波调制,各子载波并行传输。即使总信道不是平坦的,但能保证每个子信道的相对平坦性,由于子信道窄带传输,信号带宽显著小于信道带宽,大大消除了子信号间的干扰。
将高速率、高容量的数据流分解为多子路径低速率、低容量数据流,各子信号流数据采用相互独立调制并迭加在一起构成发送信号,由于信道速率及容量降低,同时码元周期增大,多径干扰将较少地遗传到下一码元,这样就降低了多径时延在信号码元中所占百分比,削弱了多径干扰对信号传输系统的影响。实验显示,依据802.11a标准指定的编码交织工序以及对应的解码解交织工序,完全恢复了原来的信息信号。下图是示波器所显示的双探头观测结果,比较两路波形,信号在灵敏度内不见有差异。
要加快OFDM功率谱带之外的部分下降速度,需对OFDM符号实施加窗处理,加窗处理可以使周期边缘幅度渐变至零,升余弦窗函数表示为式(1):(1)
Ts指加窗前的符号长度,β为滚降因子,(1+β)Ts指加窗后的符号长度。
下面的式(2)常用来刻画OFDM之输出信号的等效
由式(2)所刻画的OFDM信号有一个缺点:功率谱带外干扰衰减速度太慢,虽然增加子载波数可加快功率谱带外干扰衰减速度,但若不采用加窗技术,效果仍不够理想。
实际通信过程中,加窗过程如下:
(1)在n数字调制好的信号符后面补零,形成n个输入样本值序列。
(2)对样本值序列实施IFFT运算,将输出信号最后的前缀分别植入对应的OFDM符号之前,再将IFFT输出信号最前面Tpostfix样值植入到OFDM符号之后。
(3)将OFDM符号与式子(1)定义的升余弦窗函数棕(t)时域相乘。
(4)将经加窗后的OFDM符延时Ts,与前一个经加窗后的OFDM符号相加,相邻的两个OFDM符号之间会存在宽带为βTs的重叠区。
多载波调制(MCM)技术是将具有某一带宽的非线性信道分解为N个近似子信道,每个子信道是近似线性的,每个子信道以低速码(1/N码元速率)进行数据传输,低速率传输数据码元周期长,只要时延值与码元周期的比值小于某一定值,符间串扰就不会明显。本质上讲,MCM对信道的时延扩散不敏感,用MCM即使不采用均衡器也可获得较好的性能。
由香农公式可知,子信道频率响应为近似线性信道时,信道容量几乎达到最大值。每个子信道中,发射功率谱密度可依据信道特性决定,各信道独立编码,再采用适应于该子信道映射模式实现信号传输―――信噪比较高时采用MQAM映射模式,信噪比较低时采用BPSK或QPSK的映射模式。另外,频率间距Δf足够小时,C(f)几乎为常数,接收端不必要采用均衡算法补偿,此时符间串扰已经可以忽略。
参考文献
[1] Sunborg J. Universal Personal Telecommunication(UPT),“Concept and Standardisation.”,Erisson Review, 1993, p.70-74
[2] John G. Proakis.张力军,张宗橙,郑宝玉译. Digital Communication (Third Editon)[M].电子工业出版社,1999,2.,p.552-560
[3]姜丹.信息论与编码[M].中国科学技术大学出版社,2001,pp.125-130
[4]吕浚哲. OFDM的信道均衡技术[D].西安电子科技大学硕士学位论文,2001.1
关键词:大学;创新教育;指标体系
【中图分类号】G40-034
一、大学创新教育评价研究背景和现状
2010年6月,《国家中长期人才发展规划纲要(2010-2020年)》颁布实施,创新机制是《人才纲要》中人才发展的指导方针之一,营造创新文化和创新人才培养机制,最大限度地解放人的创造性,是我国教育改革与发展面临的最大挑战。
对于创新教育,朱永新、杨树兵教授认为:创新教育是根据创新原理,以培养学生具有一定的创新意识、创新思维、创新能力以及创新的个性为主要目标的教育理论和方法,使学生牢固、系统地掌握科学知识的同时发展他们的创新能力;阎立钦教授认为:创新教育是指在基础教育阶段以培养人的创新精神和创新能力为基本价值取向的教育实践。其核心是着重研究和解决如何培养学生创新意识、创新精神和创新能力的问题,是素质教育的重要组成部分。在创新教育评价方面,陈周见在硕士论文中具体论述了创新教育评价的基本特征、基本原则与基本方法,从创新教育工作评价、创新教育教师评价和创造力测评三个方面综合评价创新教育。
创新教育是全面素质教育的重要组成部分。我国自90年代提出创新教育理念以来,真正实施了创新教育并且成绩显著的学校并不多,大多数学校的创新教育仍停留在形式化、平庸化、浅层次的局面。有些学校虽然开展了一些创新教育的尝试,但是真正坚持下去的极少。其中的原因较多,创新教育评价的不完善是其原因之一。创新教育评价是实施创新教育的必不可少的环节,没有关于创新教育的评价就不可能有真正意义上的创新教育。
教育评价是以建立在一定的教育价值观基础之上的目标体系为依据,运用现代科学技术与方法,解析教育系统的状态变量,对其社会价值进行判断,并为教育决策提供反馈信息的过程。
创新教育评价是以一定的创新教育价值观指导下建立的目标分类体系为基准,运用现代人文科学方法及数学方法与技术,解析教育系统状态变量,对创新教育的个人本体价值和社会价值进行评鉴和判断,并为教育导向、激励和改进提供信息反馈的过程。
创新教育评价作为一个研究领域来说是绝不可忽视的。不管是在理论的研究方面,还是在实践的探索方面,其意义重大而深远。本研究课题主要从实证方面构建大学创新教育评价指标体系,将教育对象、教育内容和教育方法等一级评价指标细化为二级指标,理论与实证研究相结合,为大学创新教育的评估提供实证依据,进而正确地评价我国大学教育改革的优势。
二、大学创新教育评价指标体系设置的基本思路
创新机制是《人才纲要》中人才发展的指导方针之一,营造创新文化和创新人才培养机制,最大限度地解放人的创造性,是我国教育改革与发展面临的最大挑战。总书记在庆祝清华大学建校100周年大会上发表重要讲话,向各高校提出了"全面提高高等教育质量"的要求,大学教育要在现有基础上有所创新,与时俱进。这是推动教育事业特别是高等教育科学创新发展的纲领性文献。
大学教育要把提高质量作为教育改革发展最核心最紧迫的任务,大力提升人才培养水平,大力增强科学研究能力,大力服务经济社会发展,大力推进文化传承创新。要深化教育质量问题调查研究,建立健全适合中国国情、具有国际视野的教育质量标准。要健全高等教育质量评价体系,出台高等学校本科教学评估新方案,加强分类评价、分类管理、分类指导。要加强教育教学质量监管监测,创造条件有关教育教学质量年度报告。要积极推动协同创新,鼓励高等学校同科研机构、行业企业开展深度合作,加强产学研用结合。
因此,大学创新教育状况评价应适合中国国情,建立具有国际化的评价标准。本课题正是以《国家中长期人才发展规划纲要(2010-2020年)》为依据,从大学教育对象、教育内容和教育方法等方面全面评价高校开展创新教育的状况。
大学创新教育状况的评价可简单地表示为:
大学创新教育状况指数 = 大学创新教育对象指数 + 大学创新教育内容指数 + 大学创新教育方法指数。
本课题的大学创新教育评价指标体系设置的基本思路如下图1和图2所示。
图1
图2
三、大学创新教育状况实证评价方法的选取
(一)主观赋权法与客观赋权法
大学创新教育状况的实证评价的关键是对已选取的各指标的权重的确定。
对实际问题选定被评价的指标后,确定各个指标的权重系数,常有以下几种方法:主观赋权法,客观赋权法。
主观赋权法是由评价分析人员根据自己理解的各项指标重要性而赋权的一类方法,其原始数据主要由评价分析人员根据经验主观判断得到,常见的有专家咨询法、循环打分法、排序法、二项系数法和层次分析法等。
客观赋权法是指利用指标值所反映的客观信息确定权重的一种方法,其原始数据由各指标在被评价对象中的实际数据形成,常见的有均方差法、主成分分析法、离差最大化法、熵值法、代表计数法等。
总体来说,这两类方法各有优缺点:主观赋权法客观性较差,但解释性强;客观赋权法确定的权系数虽然大多数情况下客观性较强,但有时会与各指标的实际重要程度相悖,而且解释性较差,对所得的结果难以给出明确的解释。
在主观赋权中,一般将专家咨询法与循环打分法结合使用,具体做法是:召集或挑选同行业的一批专家,先让他们分别根据个人的经验和主观感受给每个指标确定一个权数,经过处理后,将第一轮的赋权结果反馈给各位专家,并进行第二轮评估,如此反复几次,直至专家们的评定意见比较吻合时为止。
本文中,由于各高校的发展水平不同,创新教育系统的完善程度相差较大,专家的意见比较分散,专家评价时难以把握分寸,所以不适合运用专家咨询法和循环打分法来评价本课题的指标权重。
层次分析法(AHP)是美国著名运筹学家T·L·Saaty于上世纪七十年代提出的,它体现了人类决策思维的基本特征:分解、判断、综合,并以它的简洁性、实用性、适应性和系统性得到了世界各国广泛的应用,引起了数学界和经济学界的高度重视。层次分析法的基本原理则是把复杂的问题分解为各个组成元素,将这些元素按支配关系分组形成有序的递阶层次结构,根据一定的比率标度,通过两两比较的方式,将判断定量化,形成比较判断矩阵,计算确定层次中诸元素的相对重要性,典型的应用实例是综合评价我国的电话网可靠性。
本文中确定了两个级别的指标,在评价指标的权重过程中,上层指标所支配的下层指标并没有出现相互交叉的现象,不能利用主观判断的两两比较而忽略了实际所收集数据的客观存在性,还会导致二级指标的主观叠加。排序法和二项系数法都存在主观排序的步骤,无法建立对本课题中所收集数据的支撑,再者,指标(变量)的数量众多造成在系数的计算上存在困难,所以不适合应用于本课题的评价体系中。
在客观赋权中,均方差法和离差最大化法相对简便,结合使用更能体现它们在数据处理上的优越性,均方差在数值上面的体现就是数据在均值上产生的波动,如果波动(均方差)越大,提供的信息就越多,但是,就本课题来说,指标值没有所谓的阈值,而且没有统一的量纲,如果利用最大离差法进行数据归一化处理后,均方差法处理的标准化数据不能代表各指标真正的均值和均方差,从而最终的权值和评价结果可靠性不是最好的。主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统,这在难以量化的指标评价体系中用得比较频繁。本课题中未涉及到多维变量,无需利用主成分分析法来进行降维处理和线性拟合,简单的问题复杂化不符合科学性规律,所以不予采用主成分分析法。
熵原本是一热力学概念,它最先由申农(C.E.Shannon)引入信息论,现已在工程技术,社会经济等领域得到十分广泛的应用。根据信息论的基本原理,信息是系统有序程度的一个度量;而熵是系统无序程度的一个度量,二者绝对值相等,但符号相反。如果系统可能处于多种不同状态。而每种状态出现的概率为Pi (i=1,2,...,m)时,则该系统的熵就定义为:
显然,当Pi=1/m (i=1,2,...,m),即概率相等时,熵取得最大值为:
若现设有m个待评项目,n个评价指标,形成原始指标数据矩阵R= (rij)m×n,对于某个指标rj,有信息熵
不难理解,如果某个指标的熵Ej越小,就表明其指标值的变异程度越大,提供的信息量越多,在评价体系中所起的作用越大,则其权重也应越大;反之,某个指标的熵Ej越大,就表明其指标值的变异程度越小,提供的信息量越少,在评价中所起的作用越小,则其权重也应越小。所以在具体分析过程中,可根据各个指标值的变异程度利用熵来计算出各个指标权重,利用各个指标权重对所有指标进行加权,从而得出较为客观的评价结果。
综上所述,熵值法能够比较充分利用本课题中所收集的数据,得到所需的信息量,其原理已经阐述过,广泛地应用在企业经营绩效评价、银行竞争力评价系统中,是目前常用的一种指标赋权方法。
最终,本课题采用均方差法和熵值法来分别评价知识产权竞争力状况,一方面可以比较两种常用的客观方法的优劣,另一方面验证评价结果的一致性。
(二)利用均方差模型进行评价的方法
假定需要评价某城市m个年度的知识产权发展和保护状况,评价指标体系包括n个指标。这是一个由m个样本组成,用n个指标做综合评价的问题,对此,可以建立如下的数学模型:
样本的集合为:
每一样本(评价对象)ui由n个指标的数据表征:
ui = { Xi1,Xi2,...,Xij,...,Xin } (j =1,2,...,n)
采集数据,得到评价系统的初始数据矩阵:
X = { xij } m×n (1)
上式中xij表示第i个样本第j项评价指标的数值。对初始数据进行标准化处理,以消除指标的量纲、数量级和方向的差异,得到数据的标准化矩阵:
X' = { x'ij } m×n (2)
上式中x'ij为xij的标准数据。将指标标准数据转化为概率值,得到概率矩阵:
由概率矩阵计算各指标的均值E():
由各指标的均值计算它们的均方差:
根据得出各指标的权重:
用第j项指标权重,与标准化矩阵中的第i个样本第j项评价指标接近度的乘积作为的评价值,即:
第i个样本的评价值
显然,越大,样本的效果越好。最终比较所有的数值,即可得到评价结论。
对于多层结构的评价系统,由于均方差的不可相加性,利用最底层结构指标的均方差值来计算上层结构指标的评价值,若上层结构的某一指标包含n'个最底层结构的指标,那么该指标的评价值为:
(三)利用熵值模型进行运行绩效评价的方法1
熵值模型评价方法的前两个步骤与均方差模型相同,由此接下去,
P = {pij} m×n (3)'
式中常数K与系统的样本数m有关。对于一个信息完全无序的系统,有序度为零,e=1,当m个样本处于完全无序分布状态时,由此得出
某项指标的信息效用价值取决于该指标的信息熵与1之间的差值
'
利用熵值法估算各指标的权重,其本质还是利用该指标信息的价值系数来计算的,其价值系数越高,对评价的重要性就越大。最后可以得到第j项指标的权重为:
用第j项指标权重,与标准化矩阵中的第i个样本第j项评价指标接近度的乘积作为的评价值,即:
第i个样本的评价值
同样,越大,样本的效果越好。最终比较所有的数值,即可得到评价结论。
对于多层结构的评价系统,根据熵的可加性,可以进行层次结构分析,利用下层结构的指标信息效用值,按比例确定对应于上层结构的权重数值。以两层指标体系为例,对下层指标的效用值求和,记作(k=1,2,...,q)。
下层指标对应于上层结构的权重为:
(9)'
若下层指标的评价值为,则下层指标对应于上层结构的评价值为:
(10)'
[论文摘要]从文献考据学角度,对“信息”一词源流加以考证,指出并修正当前学术界存在的一些误读、误判。通过探究“信息”一词在我国古典文献中的详细出处,提出“信息”一词最早辞源出自唐朝崔备的《清溪路中寄诸公》中这一论点。进而对“信息”一词的内涵、发展、演变进行剖析并得出结论:一切事物包括自然界和人类社会都会产生信息,信息不是事物的本身,而是由事物发出的由接收者感知、分析、判断出的消息、情报、数据、指令、信号等当中所包含的内容。
当今社会已进入“信息爆炸”、“信息革命”的时代,信息可谓无处不在无时不有。随之而来则是对“信息”的研究犹如雨后春笋一般,并渐成显学,出现了诸如“信息学”、“信息管理学”、“信息传播学”、“信息法学”、“信息哲学”等一系列成熟或半成熟的学科。我国在这一领域的研究起步较晚,但目前亦取得了一些可喜成果。当然在这些成果中,也存在不少学术争议,如关于“信息”一词的辞源等。本文力图从文献考据学角度出发,对“信息”一词的起源、发展及内涵做一定的研究和分析,以期修正当前相关学术成果中关于“信息”一词的误读、误判。
1、“信息”的源流
在研究信息科学时,一般都会提到“信息”一词的起源。对于起源问题,目前在学术界有两种代表性观点:其一为“李中说”,即许多学者普遍认同的一种观点,认为“信息”一词出自唐代诗人李中《碧云集·暮春怀故人》中的“梦断美人沉信息,目穿长路倚楼台”。关于“李中说”也有两个版本,一为“南唐李中主”;二为“中唐诗人李中”。其二为“陈寿说”,即司有和先生在其专著《信息管理学》(以下简称“司文”)一书中提出的新观点,认为“信息”一词出自陈寿《三国志》中的“正数欲来,信息甚大”。
关于此两种观点,中国人民大学档案学院的王英玮老师已经在《“信息”一词源流考》中有过论述,现将其考证结论总结如下:
“信息”一词早在唐代就已经被人们普遍利用,而李中为五代十国时的南唐诗人,因此“信息”辞源绝非可能出自李中的《碧云集·暮春怀故人》一文。(笔者注:王老师在其文“几点结论”中所写的“南唐(后唐)诗人李中”的说法有误,南唐并不等同于后唐。后唐(923-936)在南唐之前,为李存勖所建。)
司有和先生批驳“李中说”的考证基本可信,但关于南唐的立国时间记述有误,南唐的立国时间为937-975年而非902-929年。
“司文”中的“正数欲来,信息甚大”引语中的“数”为讹文,应当为“叔”,“正叔”乃北宋学者程颐之“字”。该引语中所说“信息”一词,实际上出自北宋学者朱熹的《二程外传》而非陈寿的《三国志》,所以并不早于南唐李中诗句中所提到的“信息”一词;《三国志》中也并不存在“信息”一词,“司文”中的引语实为误引。
“信息”一词的辞源,当不晚于南北朝时期的梁朝,即公元502-557年。其依据为:清代学者严可均编纂的《全梁文·卷五十二》中有“信息”一词的记录,原文为:“玲珑绮构,无风自响,不拂而净,耽耽肃肃,信息心之胜地……”。
笔者根据王英玮老师的研究思路曾仔细核对其考证结果,对于以上四点总结只同意前三点,而最后一点不敢苟同。经考证所谓“信息心之胜地”等语,其实早在唐代的《艺文类聚》第七十七卷中《内典下·寺碑》中就有记载,原文摘录如下:“梁/王僧孺/中寺/碑/曰:……威风铿锵,如鸣更戢;旁攀镂槛,斜登钿砌;煜爚金铺,玲珑绮樽;无风自响,不拂而净。耽耽肃肃,信息心之胜地;穆穆愔愔,固忘想之嘉所……”根据文章含义分析及骈文写作规律,可以看出文中“信息心之胜地”句读读法为“信/息心/之/胜地”而非“信息/心/之/胜地”,应该是和下旬“固/忘想/之/嘉所”相互对应的。所以此处表面上虽然出现了“信息”二字,但实际上“信息”一词的本义并没有出现。所以王英玮老师关于“信息”辞源“当不晚于南北朝时期的梁朝”的观点就失去了其论据,这一点是值得商榷的。
“信息”一词的最早辞源根据目前研究成果及笔者收集掌握的资料,早在南唐李中之前的唐朝就有六位诗人用过信息一词,分别为崔备(生卒年不详,建中二年(781年)进士及第)、杜牧(803—853)、陆龟蒙(?一881年)、马戴(生卒年不详,会昌四年进士及第)、唐彦谦(生卒年不详,晚唐,咸通时,举进士十余年不第;光启末,贬汉中掾曹)和鱼玄机(843?—868),根据其生活年代考察可知崔备出生最早。因此可得出,目前有据可查的、最早使用“信息”一词的文献当为崔备《清溪路中寄诸公》中的“别来无信息,可谓井瓶沉”。
值得一提的是明朝罗贯中所著《三国演义》第二十五回和第九十九回分别提到张辽和司马懿口中说出的“信息”一词,虽说《三国演义》是明朝人写的汉末三国时期的文学故事,但根据人们对《三国演义》“七分史实三分虚构”的评价,我们可以揣测张辽和司马懿能说出“信息”二字也是可能的。如果以此推测,“信息”一词在汉朝时人们就开始使用了,当然这样的推测不足为史实依据。
2、“信息”的发展
2.1 “信息”一词在唐诗宋词元曲中由微渐广
“信息”一词在唐代出现之后,并没有立即得到广泛使用。据作者现有资料统计,在唐代只有六位诗人各使用过一次,五代时一位作者使用一次。但是到两宋以后,这个词语的使用就得到了迅猛发展,不但使用的人数大量增长,而且被同一作者多次运用,例如苏轼、杨万里、黄裳、史达祖、柳永等就反复使用。据粗略统计,两宋期间使用该词语的作者就有九十多人,使用次数达一百一十余次。元朝立国时间虽然短暂,但该词已经深入人心,得到了继续沿用。参见史药房的《水龙吟》、尹志平的《江城子·义州作》和王实甫的《西厢记》等作品。
2.2“信息”一词在明清时期得到广泛使用
明清时期,“信息”一词不仅如唐伯虎这样的文人墨客、风流才子喜欢使用,如在其《题画三首》诗词中有“迂疏任是傍人笑,要探梅花信息难”之句。就连江湖豪杰如鲁达、武松;闺阁儿女如凤姐、黛妹;市井小民如四儿、五娘;奴才丫鬟如赖大、平儿;甚至是神仙鬼怪如孙猴、黄狮等,也都在广泛使用,习以为常到脱口而出。这一点在《水浒传》、《红楼梦》、《七侠五义》、《三国演义》、《三言二拍》、《聊斋志异》、《西游记》等小说人物对白中可得到映证。例如《红楼梦》第十六回“贾元春才选凤藻官秦卿夭逝黄泉路”中有:贾母便唤进赖大来细问端的。赖大禀道:“小的们只在临敬门外伺候,里头的信息一概不能得知……”从引文中可以看出,“信息”一词十分自然地出于赖大之口,说明它在当时民间口语中已经普及,而不仅仅是文人笔下“高雅”之词语了。
2.3“信息”一词至现代已拓展到社会各个领域
二次世界大战特别是20世纪40年代后期,随着信息论、控制论、系统论的问世,申农(.E.Shannon)、维纳(Norbert Wiener)等人把“信息”一词从普通用语转变成为具有特定意义的科学术语。特别是20世纪80年代前后,随着贝尔、奈斯比特、托夫勒等人把“信息”融合于社会的各个领域,“信息社会”、“后工业社会”、“第三次浪潮”、“成熟社会”等学说更使“信息”成为描述与预测社会发展的重要因素,成为社会众所瞩目的事物。目前,“信息”一词已不是单纯的科学术语或技术名词,而是社会共有的、普遍化的术语,它已经深入到社会各个领域了。
转贴于
3、“信息”内涵
3.1“信息”通常泛指“消息”、“音讯”、“情况”等
例如李清照的“不乞隋珠与和璧,只乞乡关新信息”,此处泛指故国家乡的消息、音讯或情况。又如《水浒传》第六回“九纹龙剪迳赤松林鲁智深火烧瓦罐寺”中——智深道:“兄弟,须要分手。洒家投东京去,你休相送。你打华州,须从这条路去。他日却得相会。若有个便人,可通个信息来往。”——这里的“信息”是泛指九纹龙别后的音讯、消息。这是“信息”内涵的泛指,也是其最普遍、最通用、最主要的含义,直到当今信息社会这层含义仍然占据重要地位。
3.2“信息”特指“消息”、“音讯”、“情况”等
例如《三国演义》第二十五回“屯土山关公约三事救白马曹操解重围”中——(张)辽又曰:“(关羽)但知玄德信息,虽远必往。”操摇首日:“然则吾养云长何用?此事却难从。”——此处的“信息”特指有关刘备“去向”的消息,而不是指其它的消息,这是“信息”一词内涵的特指。
3.3“信息”在发展过程中出现“情报”的含义
例如《三国演义》第九十九回——(司马)懿月 :“蜀兵千里而来,利在速战;今来此不战,必有谋也。陇西诸路,曾有信息否?”——这里的“信息”,就不仅仅是一般的“消息、音讯、讯息”的意义了,它已经具有了军事情报的含义,这是“信息”内涵的扩展。
3.4“信息”有时也代指“书信”
例如宋代程公许《去岁重阳日得彦威信附六月间二小倒及从弟倒》诗句:“万一邮传通,庶几信息闻”。再如宋代洪皓《次观表文韵》诗句:“江左四年无信息,欲传尺素羡双鱼”。再如宋代方千里《六丑》诗句:“远水沉双鲤无信息”。这里的“信息”均是代指“书信”或其内容,这是“信息”内涵的外延。
3.5“信息”在不同学科中的差异性
影响比较广泛的有以下几种:
申农认为:从通信角度看,信息是数据信号等构成的消息所载有的内容;从实用角度看,信息是指能为人们所认识和利用的但事先又不知道的消息、情况等。
维纳认为:信息既不是物质也不是能量,信息是控制系统进行调节活动时与外界相互作用相互交换的内容;信息是系统的组织性的量度。
克劳斯:信息是由物理载体与语义构成的统一体。
钟义信:信息是事物存在的方式或运动的状态以及这种方式、状态的直接或间接的表述。
ISO:对人有用能够影响人们行为的数据,而在日常用语中,信息仍然是消息、情报、情况、资料、知识等的总称。
纵览各家观点可以得出如下结论:一切事物包括自然界和人类社会都会产生信息,信息不是事物的本身而是由事物发出的,由接收者感知、分析、判断出的消息、情报、数据、指令、信号等当中所包含的内容。而我们图书情报界所研究的“信息”主要指文献信息,它是指依附于一定载体的消息、情报、数据、新闻、知识、思想等的总称。当前,随着信息技术的发展和普及,人类社会逐渐从工业社会步入了信息时代。信息已成为现代社会一种非常重要的资源,信息社会中的“信息”就像农业社会的土地工业社会的资金和技术一样,将会成为人们竞相争夺的对象,从某种意义上来讲信息就是现代社会最重要的财富,谁掌握了信息谁就掌握了未来。
“信息”是现代社会中的一个使用频率非常高的词汇,我们经常在不同的场合中使用“信息”这一概念,那么作为一个科学的概念,信息的内涵是什么呢?
各种人等对信息有不同的理解,有人认为信息就是消息,传递信息就是传递消息。这有一定道理,但不太准确。信息和消息是有区别的,一般来说信息是消息的具体内容,而消息是信息的外壳。一则消息可能包含丰富的信息,也可能只包含有限的信息。有人认为信息就是信号,信号与信息是密不可分的,但两者不能等同。信号可以承载信息,也可以传递信息,人们在使用信号这一概念时更强调传递信息的信号物理属胜,而不是其所传递的内容。同一信息可以通过不同的信号承载和传递。如教师在讲课时,可以将知识通过声音信号传递给学生,也可以通过视觉信号传递给学生。有人是从信息的功能出发给信息下定义的,如信息科学的创始人申农就将信息定义为熵的减少,即信息可以消除人们对事物认识的不确定性。
关键词:数据挖掘;体育训练;决策树ID3
中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)22-5492-04
Application Review and Analysis of Data Mining Techniques in Sport Training
XU Jian-min, OU Mu-hua, XIONG Jin-zhi
(Computer College, Dongguan University of Technology, Dongguan 523808, China)
Abstract:With the continuous development of sports, most sports are using IT to access and accumulate. Faced with a huge database and fierce competition in the game, the data mining technology in the field of sports will become a trend. This study focuses mainly on the implementation of the various algorithms based on the data mining, which investigates the algorithm based on decision tree classification applied to tennis, the algorithm based on BP neural network, and the FP-tree algorithm based on association rules. Finally, on the basis of the above method, the study analyzes the direction of improvement to and possible drawbacks of the decision-making ID3 algorithm, and provides a way of research of data mining which will be applied to sports.
Key words: data mining; sports training; decision tree ID3
目前体育数据信息的分析通常采用常规统计方法:抽样理论、假设检验、决策理论、估计理论、时间序列等[1],大多数统计分析技术都要求完善的数学理论和严谨的使用技巧,对使用者要求很高,且大多属于抽样研究,存在不同程度的丢失信息现象。此外,传统统计方法很难挖掘出数据资料的潜在规律。随着近年来体育领域数据增多,各种指标的体质监测数据,各种各类体育竞技比赛数据等越来越多,形成海量数据[2]。与此同时,计算机应用技术在存储、模拟分析数据方面有着很明显的发展潜力。于是,如何在海量数据中寻找各种因素间的相互关系、发现它们之间的变化规律,进而对数据深入分析就成为了计算机的重要发展方向之一。因此,数据挖掘技术的研究和应用成为体育科学研究中不可或缺的内容之一。
该文首先介绍数据挖掘的定义和基本方法,其次综述数据挖掘技术在国内外体育训练的应用情况,最后在此基础上经过对方法和研究方向的分析,提出未来数据挖掘技术在体育训练上的研究方向。
1数据挖掘的基本方法
数据挖掘作为一门跨学科的应用技术,它涵盖了统计学、机器学习、人工智能、模糊数学等诸多科学领域,形成了根据具体任务而进行数据分析以及知识萃取的方法体系。同样,对于相同的问题也可以根据不同的应用领域特点选择不同的算法。比如,处理描述性挖掘任务有数据特征化和数据区分等概念抽象和数据汇总概要处理;预测性挖掘任务因目标变量属性的不同有分类和预测方法。
数据挖掘的方法主要有:
1)分类:按照分析对象的属性分门别类加以定义,建立类组。
2)回归:是使用一系列的现有数值来预测一个连续数值的可能值。
3)预测:根据对象属性的过去观察值来估计该属性未来的值。
4)聚类:是将一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一个类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小。
5)关联:是要找出在某一事件同时出现的事件。主要是要找出:如果甲因素出现在某一事件的一部分,则乙因素也出现在该事件中的机率有多大。
数据挖掘常用的技术主要有决策树、遗传算法、聚类分析、神经网络技术、关联规则等[3-4]。
1)决策树
一种用树枝状展现数据受各变量的影响情况的分析预测模型,根据对目标变量产生效应的不同而制定分类规则,它是建立在信息论基础之上,对数据进行分类的一种方法。它首先通过一批已知的训练数据建立一棵决策树,然后采用建好的决策树对数据进行预测。决策树的建立过程是数据规则的生成过程,因此这种方法实现了数据规则的可视化,其输出结果容易理解,精确度较好,效率较高,因而较常用。常用的方法有分类及回归树法、卡方自动交互探测法等[3]。
2)遗传算法
一种新的最佳化空间搜索方法,它应用算法的适应函数来决定搜索的方向,运用一些拟生物化的人工运算过程进行一代又一代的周而复始的演化,求得一个最佳结果。特点是具有强固形与求值空间的独立性。强固形使问题的限制条件降到最低,并大幅度提高系统的容错能力;而求值空间的独立性则使遗传算法的设计单一化,且适用于多种不同性质、领域的问题。将遗传算法运用于数据挖掘,可以开采出与众不同的信息,是别的算法所不能替代的。
3)聚类分析
聚类分析是将数据对象分成类或簇的过程,使同一簇中的对象之间具有很高的相似度,而不同簇中的对象高度相异。一个好的聚类方法会最大化类内的相似性,最小化类间的相似性。主要聚类方法有:划分算法、层次算法、基于密度的方法、基于网格的方法、基于模型的方法。
4)神经网络技术
一种模仿人脑思考结构的数据分析模式,由输入变量或数值中自我学习并根据学习经验所得的知识不断调整参数,以期得到资料的模式。是建立在自学习的数学模型基础之上,它可以对大量复杂的数据进行分析,并能完成对人脑或计算机来说极为复杂的模式抽取及趋势分析。神经网络的处理过程主要是通过网络的学习功能找到一个恰当的连接加权值来得到最佳结果。比较典型的学习方法是回溯法。通过将输出结果同一些已知值进行一系列比较,加权值不断调整,得到一个新的输出值,再经过不断的学习过程,最后该神经网络得到一个稳定的结果。
5)关联规则
关联规则挖掘就是从大量的数据中挖掘出有价值描述数据项之间相互联系的有关知识。关联规则主要应用在商业数据库中:商品分类设计、降价经销分析、生产安排、货架摆放策略等。关联规则主要反映了一个事物与其他事物之间的相互依存性和关联性。给定一个事务集D,挖掘关联规则的问题就变成如何产生支持度和可信度分别大于用户给定的最小支持度和最小可信度的关联规则问题。
2数据挖掘在体育领域中的应用
2.1数据挖掘国内外研究情况
1)数据挖掘在体育训练国内研究的情况
查阅中国期刊中文数据库,硕士博士论文中,涉及到体育数据挖掘的体育科研论文内容主要有:体育教学、学生体质调研、运动训练监控、临场比赛优化、体育信息管理等的数据挖掘研究以及优化数据挖掘工具在体育领域的应用研究。
杨双燕、赵水宁比较全面地介绍了数据挖掘技术在学生体质调研、体育产业、竞技体育、体育决策管理中的应用方向[5]。高洪歌通过对优秀运动员参加的国际比赛中的各项技战术参数,然后运用关联规则、聚类分析和基于马尔代夫过程的数据挖掘算法,揭示了隐含于数据中的很多信息[6]。孟宪明、凌培亮从视野和步长等方面对人工鱼群算法进行改进,并提出基于该算法的乒乓球技战术分类规则数据挖掘模型,分析顶级乒乓球运动员比赛实例,结果表明与乒乓球技战术关联规则数据挖掘相比,该模型在挖掘质量和挖掘效果上有较大优势[7]。龚明波,钟平中通过对通过球队进球、射门、射门命中率、角球等11项攻防技术指标进行主成分分析的基础上,确定球队技战术能力聚类的综合指标,形成聚类样本。在此基础上,引入模拟人类视觉系统的尺度空间理论,提出了基于尺度层次空间聚类的球队技战术分类方法[8]。陈健、姚颂平以CBA联赛为背景运用关联规则得出核心运动员的得分与球队获胜的关联度,核心运动员的上场时间和关联度等[9]。
2)数据挖掘在国外体育领域中的应用现状
在新世纪初美国NBA的教练运用IBM公司提供的DM工具Advanced Scout能在比赛中辅助教练员林场决定队员替换方案,取得了很好地效果。此后,NBA球队从各方面广泛使用该系统来优化他们的战术组合。
美国国家曲棍球联盟与IBM建立了一个合资公司,推出了电子实时比赛计分和统计系统NHL-ICE.该软件可以让教练、播音员、记者及球迷共同利用NHL各类数据,使用NHL-ICE挖掘各自所需的信息。
意大利运用数据挖掘技术开发了Data Volley软件系统,实现了排球比赛的技战术统计分析。
2.2决策树算法的应用
决策树是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。分类(Classification)任务就是通过学习获得一个目标函数(Target Function),将每个属性集x映射到一个预先定义好的类标号y。分类任务的输入数据是纪录的集合,每条记录也称为实例或者样例。
决策树算法最具影响和最为典型的算法的主要是ID3算法。ID3算法的基本思想:以信息熵为度量,用于决策树节点的属性选择,每次优先选取信息量最多的属性,亦即能使熵值变为最小的属性,以构造一颗熵值下降最快的决策树,到叶子节点处的熵值为0。此时,每个叶子节点对应的实例集中的实例属于同一类[10]。
2.3神经元网络的应用
BP算法的基本思想是:学习过程分为两个部分:信号正向传播和误差的反向回传。信号从正向传播时,输入数据从输入层进入,经过各级隐层网络依次逐层处理,传递到输出层,如果输出层输出的结果和期望不相符或者差距很大,那么将误差值当做调整的信号一次各层向着相反的方向传回来,通过作用神经元之间的连接权矩阵,使误差减小。经过不断的学习,最后使得误差减小到可以接受的范围以内。具体的算法步骤如下:
1)从训练数据集中取出某一样本数据,将信息录入到神经网络中的输入端。
2)根据各个节点间的连接情况正向逐层的处理后,可以得到神经网络的输出数据。
3)计算网络输出的数据值与期望输出的数据值的误差。
4)把误差逐层按照相反的方向传回到之前各层网络,并且按照一定的原则将误差信号的值作用到连接的权值上,使整个神经网络的连接权值误差越来越小。
5)将数据集输入—输出样本逐一重复以上步骤,直到整个样本集的误差减小到可以接受的范围。
目前国内有学者将BP神经网络技术应用到研究体育生化指标对竞技的影响[12]。他们采用采用BP神经网络,输入的神经元个数为4个,隐含层5个神经元,输出1个神经元。经研究得到的结论是:
1)BP神经网络精确度比较高,预测结果清晰地预测了运动员竞技能力和比较科学的预测了运动员的未来发展趋势。
2)在体育训练中,运用BP神经网络模型对运动员生化指标数据可以预测运动员竞技成绩并且对指导教练员选拔运动员有一定的科学帮助。
2.4关联规则
数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联.关联分析的目的是找出数据库中隐藏的关联网[13]。
设I={i1,i2,…,im}是项的集合。关联规则:形如A => B的蕴涵式,其中A?I , B?I ,并且A∩B =?。支持度:P(AUB),即A和B这两个项集在事务集D中同时出现的概率.置信度:P(B I A),即在出现项集A的事务集D中,项集B也同时出现的概率.如果一条关联规则同时满足最小支持度阈值和最小置信度阈值,那么就认为它是有趣的,并称为强关联规则。给定一个事务集D,挖掘关联规则问题就是产生支持度和可信度分别大于用户给定的最小支持度和最小可信度的关联规则[14]。
3分析
3.1各种常用方法的适用范围及不足
基于数据挖掘决策树分类方法即ID3方法,比较简单明了,它构建树的步骤简单,在属性不多的情况下人为就可建立,实用性非常强。
基于数据挖掘关联规则方法的乒乓球技战术分析系统可以根据乒乓球比赛的实战数据结果进行统计分析,应用关联规则中的FP-growth算法,深入挖掘选手A和选手B在各项技术的比拼,切磋过程中的弱项和强项,也就是选手A与选手B进行比赛时哪些技战术会让自己得分,运用哪些技战术会使自己失分。不仅有利于自身选手在体育训练中加强自己的薄弱环节,并且在自己水平有限的情况下和某个个体选手对决时可以充分发挥自己的强项,尽量避免使自己失分的弱项,这样可以把握形势的主动权,取得更好的成绩。所以数据挖掘在体育训练方面的应用可以挖掘众多体育信息中潜在的规律,使体育训练和比赛朝着理性化和精确化的道路发展,故数据挖掘在体育方面产生的影响是举足轻重的。
将乒乓球比赛技战术分析做成一个实用、有效的软件,广泛的被各个乒乓球队使用,作为为教练做出正确的分析和决策提供一个参考,使教练的意见和训练更加的客观,使体育比赛更加的科学精准[11-12]。
不过这种方法有一定的不足:
1)比如如果只录入一场比赛,那么数据的说服力和准确度都会下降。并且在这种不完全数据的统计中技术水平往往也和现场情况选手的压力、体能情况和发挥息息相关。
2)就是FP-tree关联规则本身具有一定的误差。源于它是以支持度-置信度为基础的关联规则挖掘方法,在理论上缺乏严格的理论证明和基础。在阈值参数设定缺乏客观标准时就将其直接应用到客户细分中,可能会产生一些误导。
基于关联规则本身的局限,我们有必要开发更好的算法,克服这些不足,在发现规则的同时需要更多的数据,更深层次的联系才行。
3.2对基于决策树ID3算法的思考
决策树ID3算法通过学习建立一棵决策树。在生成决策树的时候,通常采用信息增益方法来确定生成每个节点时所应选择的合适属性,也就是通过选择具有最高信息增益的属性作为测试是否合适做当前属性的方法。目的是为了将划分后的获得的训练样本进行分类所需要信息最小。也就是利用该属性进行信息划分会使产生的各样本子集中不同类别混合程度降低。因此决策树采用这种规则能够有效减少对象分类所需要的划分次数。
理想的决策树有三种:1)叶子结点数最少;2)叶子节点深度最小;3)叶子结点数最少且叶子节点深度最小。但是这种最优的决策树是NP难题。因此,决策树优化问题是很难解决的。不过可以尽量通过结合实际情况优化算法使数据挖掘的分类更有效[13]。决策树ID3算法在网球的例子中尚可正确执行和得出可行的结论。但是ID3算法有一些不足:1)用户信息的计算比较依赖于特征取值的数目较多的属性,这样不太合理。
2)ID3算法在建树时,每个结点仅含有一个属性,是一种单元的算法,属性特征间的相关性强调的不够充分,无法体现出属性间相互联系的特点。
3)ID3对噪声较为敏感。
4)当数据样本集增加时,ID3的决策树会随之变化。
4结论
该文首先是对国内体育训练中数据挖掘技术的应用状况进行综述,然后对决策树的应用,BP神经网络技术在研究体育生化指标对竞技的影响的应用以及FP-Tree算法在乒乓球比赛技术分析中的应用进行分析,最后对ID3算法和FP-Tree算法提出自己的见解:虽然做成最优的决策树是一个难题,但是我们可以根据自己的经验和实际情况灵活的运用算法,即可在实际应用中取得更好的效果,比如训练人员可以根据天气等情况判定每日是否适合户外训练或比赛;另外,运用关联分析数据挖掘技术可以实现乒乓球比赛中技术运用更加合理、精确;它可以实现对实战中选手自身的技术弱项和强项的挖掘,以及运用哪些技术可以得分或失分,为比赛中技术运用提供了科学的依据。
参考文献:
[1]迟殿委,周兴斌.数据挖掘的体育训练决策支持系统[J].微型计算机,2009(25):190-192.
[2]郝丽,刘乐平.数据挖掘(Data Mining)在体育统计中的应用[J].华东理工学院学报,2004,6(5): 92-95.
[3]胡斐.数据挖掘在体育领域中的应用研究综述[J].科技创新导报,2010(27):211-212.
[4]朱明.数据挖掘[M].2版.合肥:中国科学技术大学出版社,2008.
[5]杨双燕,赵水宁.体育数据中数据挖掘技术的应用研究[J].浙江体育科学,2003,2(30): 49-51.
[6]高洪歌,赵会群.关联规则挖掘在乒乓球比赛技战术分析中的应用[J].北方工业大学学报,2003,18(1): 15-20.
[7]孟宪明,凌培亮.基于人工鱼群算法的乒乓球数据挖掘[J].计算机工程,2010,36(5): 28-31.
[8]龚明波,钟平.尺度空间层次聚类在足球球队技、战术能力分类中的应用研究[J].体育科学,2005,25(1):87-90.
[9]陈健,姚颂平.关联分析在篮球技术统计数据分析中的应用[J].上海体育学院学报, 2009, 33(5):91-94.
[10]栾丽华,吉根林.决策树分类技术研究[J].计算机工程,2004,5(9):95-96.
[11]高洪敏.数据挖掘技术在乒乓球比赛技战术分析中的应用研究[D].北京,北方工业大学,2006.
[12]赵会群,孙晶,花勇民,等.数据挖掘技术在体育比赛技战术分析中的应用研究[J].北京体育大学学报,2008,31(5):712-715.
论文关键词:税收管理绩效评价体系设计
一、税收管理绩效评价概述
税收管理绩效评价是税务机关运用一定的指标体系对税收管理过程及其结果进行概括性的评价。评价时应本着系统的、战略的、权变的眼光,注重对指标的相互关系及其权重的确定,采取客观、公正、科学、全面的评价方法,快捷准确地将信息反馈给管理层,以供实施控制决策之用。税收管理绩效评价可以从效果和效率两方面进行。
(一)税收管理绩效评价的目标
税收管理的目标是为了促使纳税人依法纳税。税收管理绩效目标服从和服务于税收管理目标,通过实施绩效评价,引导和促进税务机关实现税收管理目标。因此,税收管理绩效评价的目标应当是在税收遵从的前提下,为纳税人提供优质、高效的纳税服务,从而达到税收收益最大化和纳税满意度最大化。
(二)税收管理绩效评价的实施前提
一是要有高质量的数据资源。实施有效的税收管理绩效评价要求高度的税收信息化程度,管理数据资源高度集中,至少要到省一级,有专业的数据处理中心,对产生的数据资源实时进行校验、统计、筛选、分类、分析,有相应的保障数据质量和安全的制度和措施。二是对税收管理过程及结果进行标准化管理。要最终做出绩效评价的判断结果,除了建立科学的指标体系,还必须有可行的评价标准对评价对象进行分析评判。评价标准是评价结果产生的基准和前提。
(三)税收管理绩效评价的主体
在高度信息化条件下,税收管理主体可以分为两个层面:管理层面和操作层面。管理层面主要指省级以上税务机关和单纯具有内部管理职能、不直接面对纳税人的地市级税务机关,操作层面即为直接面向纳税人的地市级以下税务机关。在税收管理绩效评价体系下,税收管理主体就是税收管理绩效评价的主体。
(四)税收管理绩效评价的范围
现代税收管理理论中的税收管理.主要是指税收的征收管理,只包括税收执法权的管理。税务机关绩效评价包括对税务行政管理权和税收执法权行使绩效的评价。本文主要是对税务机关及其工作人员行使税收执法权的过程及其结果产生的绩效,即税收管理绩效进行评价分析。
二、构建税收管理绩效评价体系应注意事项
(一)合理设定评价指标
指标设计在以“目标管理”为手段的绩效评价体系中具有重要意义。指标既是税务人员工作行为的导向,又是评价税务人员工作业绩的标准。好的指标可以起到事前积极诱导和事后公正评价的作用,差的指标会使整个绩效评价体系失效甚至对整个税务系统造成危害。我们对税务人员工作绩效进行考核和评价的全部内容,必须涵盖税务人员7O~8O以上的工作,根据岗位职责确定指标。指标的设计要体现多元化,不仅要能综合反映税务人员的工作业绩,还要考核其工作态度、创新精神、知识水平、工作能力,是否能与他人交流与共享信息。各级税务机关也可以结合实际在此基础上自行设计指标体系。这就意味着指标的设计要坚持定量分析和定性分析相结合,对于两类指标组合权重的选择取决于被评价税务人员的岗位职责。不同的部门工作侧重点不同,有的是在于提高纳税人的满意程度,树立税务机关的良好形象,有的是在于实现税款的应收尽收、减少纳税人的税款漏征率。对量化指标要求高的税务部门,则量化指标的权重大些,对定性指标要求高的税务部门,则定性指标的权重大些。
(二)注意事中沟通
若把税务部门绩效评价体系比做一台机器,沟通在其中所起的作用就是剂,它能保证整个绩效评价体系良性运转。没有完善的信息交流和沟通机制也就没有税务部门的绩效评价体系。沟通存在于评价前、评价中、评价后三个阶段。在绩效评价实施前的指标设计阶段,税务部门的领导或评价者应把被评价人员纳入到指标的设计过程中。沟通一方面可以使绩效指标和标准成为每一个部门和税务人员均能理解的共同语言,从而对其行为产生事前诱导作用,消除排斥心理、引导接受并指导行为;另一方面也避免了指标的设计与实际相脱离,增强了指标的可操作性。对于绩效评价后的沟通,评价人员根据被评价税务人员的绩效评价结果,鼓励与组织目标一致的行为,同时对于不符合或偏离组织目标的行为予以引导,帮助找到原因,并提出改进建议使其接受进一步的培训或改变工作态度。人们最常忽视的是评价过程中的沟通,然而在评价过程中及时进行沟通引导被评价税务人员的行为,可以防微杜渐,大大改善评价结果。在实际工作中,事中沟通也通常最有效。
(三)根据个体需要选择激励手段
绩效评价与绩效付酬是不可分割的两个方面。传统行为学理论分析,行为是由动机支配的,而动机是由需要所引起的。因此了解和把握人的需要特点,是建立有效的激励制度的基础。需要的层次性决定了激励手段的多样性,即物质激励和非物质激励相结合的激励机制。对于物质激励,可以通过对薪酬体制的设计而完成,在绩效评价体系中,税务人员的工资一公务员基本工资+绩效工资x工作难易系数。对于非物质激励,可以通过“情感激励”对税务人员个体工作给予认同、尊重、表扬,对其职位的提升、赋予信任和责任来实现。评价人员必须确定被评价税务人员目前所处的需求层次和特点,并依据其特点选择适合不同个体的激励结合方式。
(四)建立硬性约束机制
激励和约束是税务部门绩效评价体系中的两个不可分割的因素,只有二者之间实现整体协调,才能发挥绩效评价的功能。绩效评价体系内的约束实际上是一个问题的两个方面,一方面如果税务人员的评价结果较差或与整个系统的目标相悖,将遭受批评和惩罚,为此付出代价;另一方面对评价结果差的税务人员的处罚就是对其他税务人员的约束,或者说是反面激励,从反面达到激励约束相容。由此我们可以看出,在绩效评价体系中,激励和约束是紧密联系在一起的,它们协同在一起发挥最优作用。
三、不同层面设计税收管理绩效评价体系的探讨
(一)税收管理绩效评价技术的运用及其分析
1.基于平衡计分卡的绩效评价。
平衡计分卡是一种综合绩效管理体系。它将组织经营任务的决策转化为四大部分的指标:财务、顾客、内部流程、学习与发展,将组织战略分为这四个方面的考察目标,每一考察目标分别设置几个独立的指标,多种指标组成了相互联系的一个系列指标体系。这些目标和指标既保持一致又相互加强,构成了有机的统一体,从而达到财务指标与非财务指标、短期与长期、内部与外部、过去与未来之间的平衡。因此,利用平衡计分卡进行管理决策,能明确地看出它对整个税收管理绩效评价体系研究组织战略目标所带来的影响。在平衡计分卡中,财务方面是平衡计分卡的最终结果,财务指标的实现是客户满意和客户忠诚的结果。只有实现内部流程的效率性和一致性,即在时间、质量和价格方面满足客户,才能达到客户满意和客户忠诚。而内部流程的优化与否主要取决于企业员工的能力。
2.基于关键指标的绩效评价。
关键绩效指标的类型主要有数量、质量、成本和时限。在确定关键绩效指标时,指标的设定要具体,切中目标、适度细化、能够权变;指标是可度量的,是数量化和行为化的,数据或信息要具有可获性;要具可实现性,在付出努力的情况下,在适度的时限内可以实现;要有现实性,是可证明和观察的,不是假设或主观猜测;指标的设定要考虑时间,关注效率。
3.基于目标的绩效评价。
目标管理下的税收管理绩效评价体系研究是以系统论、控制论和信息论为理论基础,把以工作为中心和以人为中心的管理激励方法有机地结合起来,把工作任务量化,层层分解。目标管理法是为了改善组织在竞争中软弱无力所实施的一项措施,通过权力下放和自我控制来提高组织的竞争力,它建立在充分信任和信息透明的基础上,更强调人的创造性和主观能动性。基于目标的绩效评价方法主要有四个操作步骤:设定绩效目标、确定目标达到的时间框架、实际绩效水平与绩效目标相比较、设定新的绩效目标。
(二)管理层面基于目标的税收管理绩效评价体系分析
1.基于目标的关键绩效指标体系构建要求。
管理层面的工作要强调纳税人导向、结果导向。它需要为操作层面提供政策咨询、宣传培训、协调审批等服务,而这些工作始终要围绕顾客的需求进行。管理层面许多工作的最终结果要靠操作层面的执行来实现,为体现它的导向思想,有必要将其工作绩效与操作层面的主要执行结果挂起钩来。管理层面要通过对关键绩效指标的筛选来突出工作重点,调整衡量标准,要加大对主体业务和主要职能的评价力度。对过程的控制主要通过正确执行管理体系文件来实现,采取抽查的方式进行,将需要关注的重要过程筛选出来,每次只从其中抽取部分进行检查。
2.基于目标的绩效评价体系设计思路。
管理层面的绩效评价根据“目标引导,面向流程”的指导思想,按照“质量方针一总体目标一具体质量指标”的思路,结合管理层面的主要职能,建立起基于目标的规范化、标准化、精细化、科学化的绩效评价体系。
(1)政策和制度的有效性。主要体现为税收政策能够有效地保证税收职能的实现,有利于保证税收“应收尽收”的收人组织原则,有利于收人水平的调节和收人公平分配,有利于营造公平有序、诚信纳税、和谐的税收环境,有利于促进依法治税目标的顺利实现。评价该绩效目标的指标可以使用税收征收率这一指标进行评价。
(2)税收分析预测的准确性。受指令性税收计划的影响,政府部门一度强调用税收完成数来评价税收管理工作。要解决这样的问题,一是要树立制定科学税收计划的观念,实事求是地测算和上报建议计划以及影响收人的主要增减因素;二是运用科学的手段做好收人预测工作,对税收预测的效果主要引人税收收人预测准确率指标来评价,同时把查补税款总额作为税款预计水平的一个修正指标。
(3)税收数据质量和安全性。有效的税收监控是税收管理的基础,而它又是建立在有效的数据管理基础上。管理软件通过采取有效手段,对各类数据进行检验、审核、检测和维护,及时发现和避免异常数据,清理垃圾数据、冗余数据,纠正错误信息,确保数据信息真实、准确、完整和实用。数据高度集中,对管理层面而言,维护管理信息系统的安全性也很重要,可以通过垃圾数据量、冗余数据量、数据利用程度、应急预案启动的次数、数据灾难发生的次数以及解决效果等方面设定评价指标。
(4)纳税评估的质量和效果。纳税评估的有效性评价应当包括评估对象确定的准确性、评估发现的问题户数、补缴税款、移交稽查户数以及纳税人真实申报率的提高等方面。
(5)执法监督的有效性和法律救济的处理能力。依法治税是衡量税收管理工作绩效的核心标准和实现税收各项职能的核心途径。管理层面通过执法监督和法律救济,可以通过执法检查、纳税人投诉、案件复查等方式进行,主要通过税务案件应诉维持率、复议案件维护率、税务案件审理准确率等指标来评价。
(6)提供服务的质量。无论纳税人将需求直接传递还是由操作层面传递给管理层面,管理层面都应当等同于与纳税人直接传递,进行及时、准确的处理。因此,顾客需求的有效处理率、处理及时性和准确性都应当成为关注的内容。
(三)操作层面基于平衡计分卡的税收管理绩效评价体系分析
1.财务的税收征收率指标选择。
税收管理战略目标主要是提高纳税人税收遵从程度,在财务角度主要体现为实现税收收益最大化,其“核心结果”指标主要体现为税收征收率的高低。在一定的经济发展水平和既定的税制模式下,税收管理水平的高低决定了法定税收收人的实际征收量。因此,财务方面的指标主要体现为对税收管理水平的衡量和评价,具体包括纳税人户籍管理水平、核定征收户管理质量、纳税申报质量以及税负水平四个方面的相应指标。核心结果指标则依据税收经济观,在征管能力一定的情况下,税收规模随经济的波动而波动。从理论上说,只要税务机关依法治税,对无知性税收不遵从的纳税人提供优质服务,对自私性不遵从的纳税人加强管理监控,就能够实现应收尽收。在评价是否实现有效地组织税收收人方面,用税收征收率进行评价。
2.征管过程驱动性指标选择。
(1)纳税人户籍管理水平。按照属地管理的原则,户籍管理水平主要反映评价期该辖区内纳税人获得的全面性,以及纳税人各项基础信息是否真实、准确。主要由税务登记率、发票使用率、户均发票使用量、税控装置数据采集率等指标来评价。
(2)核定征收户管理质量。在日常税收征管中,加强对核定征收户的管理和评价,可以有效监控操作层面行使推定课税权的情况,降低风险,实现核定工作的公平、公正、公开,进而提高税收征收率。主要由查账征收率、定额调整率、定额户转查账户比率、个体户平均税负、未达起征点率、停业复业率等指标来评价。