时间:2022-05-09 09:08:15
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇数据分析方法,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
· 为什么要做数据分析?
· 数据分析的目的是什么?
· 数据分析的一般过程是怎样的?
· 有哪些数据分析方法?
· 在服务性行业里,数据分析方法有哪些需要特别注意的地方?
· 在国内最容易犯哪些数据分析的错误?
因笔者能力和精力有限,文章中存在错误或没有详尽之处,还望各位读者见谅并恳请及时指正,大家相互学习。
(一)数据分析的核心作用
根据国际标准的定义,“数据分析是有组织、有目的地收集并分析数据,通过将数据信息化、可视化,使之成为信息的过程,其目的在于把隐藏在看似杂乱无章的数据背后的信息集中和提炼出来,从而总结研究对象的内在规律。”在实际工作中,数据分析能够帮助管理者进行判断和决策,以便采取适当策略与行动。
这里需引起关注的是任何没有目的或结果的分析报告都是“忽悠”,都仅仅是没有灵魂的躯壳!我们经常看到国内的同事们忙于各种所谓的“数据分析报告”,堆砌了大量的图表和文字,显得“专业”、“美观”,但认真研读后却发现缺乏最关键的“分析”过程,更别说什么分析结果了。显然大家只是把对事实的原始描述当成了数据分析,而实际上描述原始事实只是数据分析过程的一项内容而非全部。数据分析不能仅有报表没有分析,因为“有报表不等于有分析,有分析不代表有效执行”,报表只是数据的展现形式;数据分析也不能仅有分析没有结论,没有结论的分析无疑“差了一口气”,对实际业务工作无法产生价值,唯有通过分析得出结论并提出解决方案才能体现数据分析协助管理者辅助决策的核心作用。因此数据分析来源于业务,也必须反馈到业务中去,没有前者就不存在数据分析的基础,没有后者也就没有数据分析的价值了。
(二)数据分析的分类
最常见也是最标准的数据分析可分为三大类:描述性数据分析、探索性数据分析以及验证性数据分析。
所谓描述性分析是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所代表的总体特征。这种分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布以及一些基本的统计图形,比如上个月的平均通话时长是多少,员工离职率是多少等等。
探索性数据分析是指对已有数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法,侧重于在数据之中发现新的特征,比如呼叫中心的一次解决率和哪些因素相关?他们背后的驱动因素又有哪些?哪些因素是“因”、哪些又是“果”等等。
而验证性分析是依据一定的理论对潜在变量与观察变量间关系做出合理的假设,并对这种假设进行统计检验的现代统计方法,侧重于验证已有假设的真伪性。验证性分析是在对研究问题有所了解的基础上进行的,这种了解可建立在理论研究、实验研究或两者结合的基础上,比如从调研的结果来看本月的客户满意度比上个月高出2%,是否真是如此;男性客户的满意度是否高于女性客户等等。
(三)数据分析的一般过程
通常来讲完整的数据分析过程可分为以下几步:明确数据分析的目的、采集并处理数据、分析及展现数据、撰写分析报告。
现实情况中人们往往在做数据分析时陷入一大堆杂乱无章的数据中而忘记了分析数据的目的,数据分析第一步就是要明确数据分析的目的,然后根据目的选择需要分析的数据,明确数据分析的产出物,做到有的放矢、一击即中!
其次,在做数据分析时要根据特定需求采集数据,有目的地采集数据是确保数据分析过程有效的基础,采集后的数据(包括数值的和非数值的)要对其进行整理、分析、计算、编辑等一系列的加工和处理,即数据处理,数据处理的目的是从大量的、可能是难以理解的数据中抽取并推导出对于某些特定人群来说是有价值、有意义的数据。
接着是对处理完毕的数据进行分析和展现,分析数据是将收集的数据通过加工、整理和分析、使其转化为信息,数据展现的方式有两类:列表方式、图形方式。
最后,整个数据分析过程要以“分析报告”的形式呈现出来,分析报告应充分展现数据分析的起因、过程、结果及相关建议,需要有分析框架、明确的结论以及解决方案。数据分析报告一定要有明确的结论,没有明确结论的分析称不上分析,同时也失去了报告的意义,因为整个数据分析过程就是为寻找或者求证一个结论才进行的。最后,分析报告要有建议或解决方案,以供管理者在决策时作参考。
(四)客户中心常用的数据分析工具及简介1 Excel
Excel是微软办公套装软件的一个重要组成部分,它可以进行各种数据的处理、统计分析和辅助决策操作,广泛地应用于管理、统计财经、金融等众多领域。Excel提供了强大的数据分析处理功能,利用它们可以实现对数据的排序、分类汇总、筛选及数据透视等操作。
2 SPC
SPC(Statistical Process Control)即统计过程控制,是一种借助数理统计方法的过程控制工具。实施SPC的过程一般分为两大步骤:首先用SPC工具对过程进行分析,如绘制分析用控制图等;根据分析结果采取必要措施:可能需要消除过程中的系统性因素,也可能需要管理层的介入来减小过程的随机波动以满足过程能力的需求。第二步则是用控制图对过程进行监控。
3 SAS
SAS是用于决策支持的大型集成信息系统,但该软件系统最早的功能限于统计分析,时至今日,统计分析功能仍是它的重要组成部分和核心功能。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,SAS提供多个统计过程,用户可以通过对数据集的一连串加工实现更为复杂的统计分析,此外 SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。
4 JMP
JMP是SAS(全球最大的统计学软件公司)推出的一种交互式可视化统计发现软件系列,包括JMP,JMP Pro,JMP Clinical,JMP Genomics,SAS Simulation Studio for JMP等强大的产品线,主要用于实现统计分析。其算法源于SAS,特别强调以统计方法的实际应用为导向,交互性、可视化能力强,使用方便。JMP的应用非常广泛,业务领域包括探索性数据分析、六西格玛及持续改善(可视化六西格玛、质量管理、流程优化)、试验设计、统计分析与建模、交互式数据挖掘、分析程序开发等。 SPSS(Statistical Product and Service Solutions)“统计产品与服务解决方案”软件,是世界上最早的统计分析软件,基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数,SPSS也有专门的绘图系统,可以根据数据绘制各种图形。
6 Minitab
Minitab软件是为质量改善、教育和研究应用领域提供统计软件和服务的先导,是全球领先的质量管理和六西格玛实施软件工具,具有无可比拟的强大功能和简易的可视化操作,对一般的数据分析和图形处理都可以应付自如。
环境监测数据可以反映出某一区域内的环境质量状况、污染物的排放情况以及环境受污染的程度。各项数据的不断汇总并分析为各级环保主管部门以及相关机构做决策提供了技术依据。因此,采用健全的质量保证体系以及方法来保证数据的分析质量很有必要。首先,我们先来了解监测数据分析的方法。
(一)统计规律分析
就是采用数理统计方法、模糊数学方法以及适用于小同环境要素的数学和物理方程等方法,对所得的监测数据进行深度剖析,做出详细的分析评价。这种数据分析方法主要适用于环境调查、环境规划和环评等工作。
(二)合理性分析
实际的环境监测中,影响环境要素变化的因素错综复杂,而有效的能用于综合分析的监测数据十分有限,所以我们需要考虑到各种环境要素之间的相互影响,以及监测项目之间的关系,理论结合实际全面分析数据的合理性,这样才可能得到准确可靠的、合理的监测数据分析结果。
二、提高环境监测数据分析质量的方法
为了促进环境执法工作的严肃和公正,在科学化环境管理政策中,提高环境数据分析质量很有必要。在前人的研究工作基础之上,我们提出了以下几种方法来提高数据分析质量。
(一)加强审核
加强各项审核是提高环境监测数据分析质量的重要方法,它主要是指加强对现有数据的综合审核。在进行例行监测或是年度监测计划时,我们的工作一般都是连续性的展开的,一年或是好几年,因此,我们可以建立一个动态的分析数据库,录入每次的监测数据,包括每个污染源的详细信息(污染点的地理位置和排放口的排污状况等),在以后的审核中,我们可以迅速地在数据审核中对于同一采样点、同一分析项目进行新旧数据的分析对比。当数据分析结果出现异常时,可以及时的发现并找到原因,这可以对污染应急事故的发生起到提前警示的作用。另外,在数据审核中,也要密切注意到同一水样、不同的分析项目之间的相关性,比如:同一水体中氟化物和总硬度、色度和pH的关系、氨氮和总氮之间的相关性等,这样也能及时发现数据分析中出现的误差。
(二)加强监督机制
通过调研我们发现,目前在传统的监测数据质量控制系统中依旧存在许多不足,我们可以通过引入反馈和交流机制,加强监督机制来有效提高数据分析的质量。首先,通过强化平面控制,在系统内部全面优化管理的模式,提高工作人员的分析技术水平,尽可能的减少或消除数据误差,以此来提高监测分析的准确性;其次,我们应该主动接受来自外界的监督,对于外界有异议的监测数据要进行反复的检测;再次,我们也应该多举办技术交流会,让技术人员可以与各级环境监测部门的人员沟通,学习他们的先进技术和方法,同时进行数据分析结果对比,找到自身的不足,发现问题并能及时更正。
(三)加强采样及实验室测量质量的控制
1.采样控制
工作人员在每次采样前,都应该根据实际环境情况来制定采样技术细则,做好采样控制,比如:需要校准仪器并确保仪器可以正常运转;使用的采样管和滤膜要正确安装,采样器干净整洁没有受到污染源的污染,其放置的位置也能满足采样要求等。采集好的样品,要妥善存放避免污染。如果样品不能及时进行检测,考虑到样品的稳定性,最好将样品密封并存放在于冰箱中。
2.实验室测量控制
在实验室进行样品测试之前,首先应该对所要用到的玻璃量器及分析测试仪器进行校验。日常工作中,也应该根据各种仪器保养规定,对仪器定期进行维护和校验,确保仪器可以正常运转工作。其次,需要准确调配各种溶液,特别是标准溶液,配置时要使用合格的实验用蒸馏水。测试数据时,先要测定标准样品并绘制标准曲线。测定样品时要检查相关系数和计算回归方程,并对实验系统误差进行测验,每一步都不能少。
三、结束语
【关键词】数字电视;地面覆盖;测试
1.测试方案的制定
数字电视测试方案制定时,第一步是确定选择多少个地点进行测试,以及它们的特定位置。被选定的地点在数学统计上必须是相关的,通常应超过100个(最好超过200个)。在给定方向上最远的测试地点距离通常由F(50,90)曲线确定,FCC过去使用的确定NTSC频率规划的方法也被用于DTV的频道分配。发射机的ERP和HAAT首先影响最远距离的测试地点的确定。另外, 如果在数字电视发射机附近有模拟NTSC发射机且频率接近,则测试计划还应包括测量模拟信号,比较模拟电视的数值和数字电视的数值。
2.数字电视场强测试数据分析方法
标准的归一化的数据采集方法对于结果的分析来说是非常重要的。尽管对一个广播公司而言,特定的地理环境可能会有一些唯一的与其它地方不同的测试结果,但是,测试中的一些关键参数,是非常重要同时又是必须测试的。
例如,有不同的服务区域预测技术要考虑。旧的基于统计测量的方法所得到的F(50,50)和F(50,10)曲线,从50年代起在约50年的时间内,被用作预测场强数值(dBmV/m),这两条预测曲线,在FCC规则的73.699节中出现(参考资料5),给出了预测的50%的地点在50%或10%的时间概率下的最小场强电平,通常使用的F(50,90)曲线是从F(50,50)和F(50,10)采用下式计算得到:
F(50,90) = F(50,50)-[F(50,10)- F(50,50)]
就是说,F(50,90)场强电平值高于F(50,50)值,F(50,10)场强值低于F(50,50)值。这些FCC的标准曲线是基于发射机的ERP和HAAT、接收装置的天线高度、发射机与测试地点之间距离而确定。通过在每一个测试地点应用这些曲线,场强电平可以被预计并且与测量的场强电平相比较。同样,可以计算出超过最小场强电平的被测地点的百分比,按照统计规律,这些地点能基于F(50,90) 曲线成功地接收数字电视信号。可以直接比较在最小场强电平以上的测量地点数量和成功地接收数字电视信号的地点数量。
另一种场强电平预测技术是Longley-Rice算法,在FCC的工程技术部门(OET)公告69号(参考资料7)中有详细的描述,不仅用到发射机的ERP,HAAT和接收装置天线高度,而且涉及到在发射机和接收装置之间的地面的类型。应用这种算法可以预计每个测试地点的场强电平,这些预测值也应与测量的数值进行比较。对于F(50,90)曲线,基于Longley-Rice算法,可以计算出最小场强电平以上的地点的百分比,以给出能成功地收到数字电视信号的地点的百分数。这能直接与成功地接收数字电视的地点的测量数字进行比较。
两种场强电平预测方法不仅能评估数字电视的场强分布曲线和效果,也能评估成功地进行数字电视服务的区域和效果。随着更多的数字电视发射机投入使用,进行覆盖状况的试验和分析,将会有更好的统计曲线来预测数字电视的覆盖曲线。实际上,原有的F(50,50)曲线与实际的对于数字电视覆盖的要求是不同的,数字电视要保证可靠接收,要求是F(90,90)。
还有几个其它的参数被用于数字电视场强测试评估:服务有效性、系统性能指标、造成误码的极限电平、场强电平、C/N门限值、接收机灵敏度、地形轮廓及高度变化的统计等。并且每个参数在数字电视的系统构成上提供宝贵的信息,并且被分别描述。
服务有效性是指所有的可成功地接收数字电视信号的测试地点的百分比,包括那些场强电平较小但又可以成功解码的所有的地点,对广播公司来说是重要的,在测试的期间给定发射机ERP和HAAT,它是表示覆盖区域的大小和服务有效性的主要参数。
另一方面,作为数字电视场强的测试手段,系统性能指标是其效果如何的一种表示方法。即,接收S/N在15dB(误差极限)以上的站点的百分比。这种统计分析所确定的距离,对于那些低于接收门限的数字电视信号测试点(如严重的地形遮挡或天线增益过小)无效。在场强测试期间,在非白噪声干扰情况下(如多径反射、脉冲干扰或模拟电视与数字电视同频干扰),系统性能指标可从本质上得到很好的反映。
对于数字电视的接收而言,接收机的灵敏度同样影响到接收的效果,实际上是覆盖范围的大小。接收机的最小接收门限值越低,越容易收到数字电视节目。反过来,在许多高于接收门限电平的地点并非一定能很好地接收,还受到载噪比门限的限制,只有载噪比门限超过所要求的数值,才能可靠地对数字电视信号进行解码。可靠接收取决于两个条件,一是接收的场强大于接收机的最小输入门限电平,二是接收信号的载噪比大于可靠解码所要求的数值。
场强电平统计显示出所有测试地点的场强电平百分比(dBmV/m),作为成功接收的条件,要求场强电平值大于接收机的门限。基于现场试验车的接收机参数(例如天线增益,同轴馈线损耗,系统前置放大器增益和噪声系数,以及在误差极限S/N以上的比率)。这是能成功接收数字电视地点的最大的百分比,并且能与实际的服务效果比较。当然,也能与从F(50,90)曲线和从Longley-Rice算法得来的场强电平预测数据相对比。这些场强电平并不能显示出在这些地点存在的频道失真量(频道的背景噪声与接收到的射频频谱形状)。基于这个原因,建议所有的数字电视现场试验不仅仅只进行数字电视的场强测试,同时,也应进行包括频道失真和专业解调器误码率的测量。
Abstract:In view of the problems of the social survey data processing and analysis, this paper establishes the mathematical model of three dimensional matrix which is based on the three dimensional matrix.On the basis of the established three dimensional matrix model,we can use the properties of three dimensional matrix to deal it with a variety of mathematical methods, and use the hypergraph theory for further analysis. This enriches the method of the survey data processing greatly.
Key Words:Social survey data;Three-dimension matrix;Hypergraph
社会调查是了解各方面信息的重要途径之一,社会调查数据主要是通过调查问卷的方法得到的。由于社会调查数据的维数较高,加上人为主观因素,数据类型主要为二元变量、离散变量、序数变量等为主,所以对于社会调查数据的分析和处理大都基于统计学,只对单一题目进行统计学分析,其分析方法主要是基于题型进行处理的,对于题目和题目之间的关系很少关心[1]。许多数据挖掘算法因为种种限制无法在社会调查的数据分析中得到应用。因为方法的限制,所以现在很多社会调查只能验证事先想好的内容和假设,很少可以对高维数据进行相对复杂的回归分析处理。
根据以上存在的问题,该文建立了基于三维矩阵的数学模型,将单选题、多选题和排序题用向量形式进行表示,每一题定义为空间中的一个维度,从而所有的题目就可以构成一个N维空间。每份问卷的信息用一个M×N矩阵表示。这样表示可以将所有问卷内容当作一个整体,作为后续算法的基础。
1 社会调查数据的特点
通常情况下,社会调查数据特点如下。
(1)相关性。对于一个样本个体而言,它具有本身的多个特征,这些特征之间就具有一定的相关性。对于多个样本而言,个体与个体的特征之间具有相关性。如果样本随时间而变化,那么该样本在不同时刻的特征之间又具有相关性。因此,由于上述多个原因使得社会调查数据具有了复杂的相关性,传统的统计学调查难以解决这样的问题。
(2)离散性。因为社会调查数据是通过自填式问卷、网络调查数据库等方法得到,所以社会调查数据一般以离散变量为主,且这些数据之间只有标示作用,并没有严格的逻辑关系。
(3)模糊性。社会调查数据当中不可避免的会接触到各种表达方式和概念,因此,它具有模糊性。
因为由自填式问卷或结构式访问的方法得到的社会调查数据具有以上特点,所以在实际应用中基于统计学的处理方法只能笼统的显示数据的部分特性,如频数、离散程度等[2]。对于数据之间的关系只能分析出维数极少的大致的关系。
而且利用软件进行数据挖掘时,因为现有的软件中的数据挖掘算法对于数据类型和格式要求较高,所以能应用到的数据挖掘算法很少。就算是数据要求较低的关联分析,其结果也存在大量的冗余。因此,我们需要建立一个合适的社会调查数据的数学模型来完善原先的方法并使跟多的数据挖掘方法可以运用到其中,使得结果更准确。
2 社会调查数据的建模
研究中我们发现,三维矩阵可适用于社会调查数据的建模。
2.1 三维矩阵的定义
三维矩阵的定义:由n个p×q阶的矩阵组成的n×p×q阶的矩阵A称为三维矩阵,又称立体阵。Ak,i,j表示三维矩阵A的第k层,第i行,第j列上的元素。其中n,p,q分别表示三维矩阵的高度,厚度和宽度。
2.2 三维矩阵模型的建立
调查问卷的题目一般有三种类型:单选题、多选题和排序题。这三类题目都可以表示成向量的形式,其中每一道单选题、多选题可以表示成一个向量,排序题可以表示成多个向量组成的矩阵。对于单选题和多选题,可以按选项的顺序可以表示成一个向量,其中选中的项用“1”表示,未选中的项用“0”表示。对于排序题,可以表示成一个n×n的方阵,其中n表示该排序题的选项个数,。这样,每一题就可以定义为空间中的一个维度,从而所有的题目就可以构成一个N维空间。每份调查问卷的信息用一个M×N矩阵表示(M为题目的最大选项数),其在每一维上的选择称之为一个元素,这样每份问卷的信息就包括了N个元素。以第1,2,3题数据为例,其中第1题为单选题选择“B”,用向量表示为一个元素,第2题为多选题选择“ACE”,用向量表示为一个元素,第3题为排序题顺序为CBADEFIHG,用矩阵表示,每一个列向量是一个元素,如图1所示。
那么,假设有一问卷信息用一个大小为M×N的矩阵表示。K份的问卷信息就可以用K个大小为M×N的矩阵表示。将这K个矩阵叠加,形成一个三维矩阵。这个三维矩阵就是我们建立的三维矩阵数学模型,如图2所示。
在图2中我们看到,该三维矩阵数学模型有三个坐标轴,它们分别是题目,人数,选项。题目轴以每一道题为一个单位;人数轴以每一份问卷为一个单位;选项轴的刻度为A,B,C,D,E,F等题目选项,其个数为该调查问卷中选项最多的题目的选项个数。
在此基础之上,这样的三维矩阵具有以下性质。
(1)在题目轴中选取对应的题目,将三维矩阵面向竖切得到截面1(如图2中01所示),截面2表示每一道题所有人选择的信息。
(2)在人数轴中选取对应的人,将三维矩阵横切得到横截面1(如图2中02所示),横截面1表示对应的人选择所有题目的信息。
在得到三维矩阵后,可对它进行像素化处理,置1的元素用黑点代替,置0元素的则空白,在得到像素化三维矩阵后我们可以将三维矩阵沿着人数维度上向下投影,这样就可以得到一个具有浓黑不一的点的平面。通过这些点的浓度,可以知道每一选项选择的人数。接下来我们可用灰度级表示点的浓度,筛选出浓度大于一定程度的点,在此基础上进行后续算法处理。
上述三维矩阵数学模型具有数学三维矩阵的所有性质,可依据调查问卷的需求进行转置,加权、相乘、筛选等数学处理,另外在数学处理的基础上,采用超图理论可以大大丰富了调查问卷的处理方法。
3 基于超图算法的调查问卷分析技术
超图是离散数学中重要的内容,是对图论的推广[3]。超图是有限集合的子系统,它是一个由顶点的集合V和超边集合E组成的二元对,超图的一条边可以有多个顶点的特性,这与一般的图有很大不同。超图分为有向超图与无向超图两类,在无向超图的每条超边上添加方向后得到的有向二元对就是有向超图。超图在许多领域有广泛的应用。
大家可以利用无向超图表示每一道题的选择情况,先将这每一题的每一个选项设成一个节点,然后将三维矩阵从上向下投影,如果某一题的若干个选项同时被一个人选择,就用一条超边包围这些节点,那么选这些选项的人越多,投影得到的超边就越浓。这样就用超图表示了问卷中每道题的信息,可以进行聚类处理。
利用有向超图,可以将关联规则表示成有向超图的形式,在得到了关联规则后,设实际中得到的关联规则的形式为:,前项和后项都是由多个项组成的集合。该文定义一条关联规则由一条有向超边表示,有向超边的头节点表示关联规则的前项,有向超边的尾节点表示关联规则的后项。每条有向超边的头节点和尾节点均可以为多个,如此便成功表示了复合规则,从而可以使用相关算法进行冗余规则检测。
通过基于有向超图的冗余规则检测就可以将关联规则之间存在着的大量冗余检测出,减少挖掘资源的浪费,从而增加了挖掘结果的有效性。
传统的聚类方法都对原始数据计算它们之间的距离来得到相似度,然后通过相似度进行聚类,这样的方法对于低维数据有良好的效果,但是对于高维数据却不能产生很好的聚类效果,因为高维数据的分布有其特殊性。通过超图模型的分割实现对高维数据的聚类却能产生较好的效果。它先将原始数据之间关系转化成超图,数据点表示成超图的节点,数据点间的关系用超边的权重来表示。然后对超图进行分割,除去相应的超边使得权重大的超边中的点聚于一个类中,同时使被除去的超边权重之和最小。这样就通过对超图的分割实现了对数据的聚类。具体的算法流程如下。
首先,将数据点之间的关系转化为超图,数据点表示为超图节点。如果某几个数据点的支持度大于一定阈值,则它们能构成一个频繁集,就将它们用一条超边连接,超边的权重就是这一频繁集的置信度,重复同样的方法就可以得超边和权重。
然后,在基础此上,通过超图分割实现数据的聚类。若设将数据分成k类,则就是对超图的k类分割,不断除去相应的超边,直到将数据分为k类,且每个分割中数据都密切相关为止,同时保持每次被除去的超边权重和最小,最终得到的分割就是聚类的结果。
如图3所示是基于超图算法的选题型调查问卷的分析技术的流程图,主要包括4个主要部分,一是用向量表示调查问卷结果,二是将向量表示的调查问卷转化为三维矩阵数学模型表示调查问卷结果,三是使用超图算法进行优化,四是根据要求显示调查问卷结果。
【关键词】正交设计;方差分析;极差分析;试验设计;工业应用
一、正交设计的应用类型
基本上有四种情况:有交互作用和无交互作用,重复试验和无重复试验。相应的对这四种情况所构造的正交表也有所区别具体情况如下:(1)无交互作用是指实验各因素之间是相互
独立的,只是单个因素的水平变化对指标有影响,因素间各水平的联合搭配对指标没有影响或影响可以忽略不计,这种情况对正交表的构造没有影响。(2)有交互作用是指在进行实验时,有时不仅因素的水平变化对指标有影响,而且有些因素间各水平的联合搭配对指标也产生影响,这种联合搭配作用称为交互作用。当出现了交互作用时,正交表的构造也要发生相应的变
二、方差分析在工业上的应用举例
下面以一个三因素、三水平的无重复实验,无交互作用的工业生产例子进行分析一下:例,某水泥厂为了提高水泥的强度,需要通过试验选择最好的生产方案,经研究有三个因素影响水泥的强度,这三个因素生料中矿化剂的用量,烧成温度,保温时间,每个因素都考虑3个水平,具体情况如表,试验的考察指标为28天的抗压强度(Mpa),分别为44.1,45.3,46.7,48.2,46.2,47.0,45.3,43.2,46.3。问:对这3个因素的3个水平如何安排,才能获得最高的水泥抗压强度?
上述例子中指标为抗压强度,影响指标的因素为A(矿化剂的用量),B(烧成温度),C(保温时间),例中只有三个因素,三个水平,L9(34)、L27(318)这两张表都至少有四个列。因此,都可以用来安排这个试验。我们要求尽量少做试验。
对上述例子应用SAS编程,只用输入主效应项,运行后的结果如下:
从输出结果中可以看出,在A(矿化剂的用量)的第二个水平下的均值最大,在B(烧成温度)的第三个水平下的均值最大,在C(保温时间)的第三个水平下的均值最大。根据实际因素,(抗压强度)越大越好,因此在A2B3C3的条件下,即在矿化剂的用量4%,烧成温度1450℃,保温时间40的条件下生产,抗压强度最大。
三、正交设计法的应用步骤
(1)定指标,挑因素,选水平;(2)选择正交表、排表头;(3)排试验方案表,做试验,填数据;(4)分析数据,选取合适的生产条件。通过验证试验,找出较稳定的较优生产条件,进行小批量考验,最后纳入技术文件,才算完成一项正交试验的全过程。
参 考 文 献
【关键词】洞桩法(PBA法);隧道监测;数据分析
1、工程概况
呼家楼站位于东三环北路与朝阳北路的交叉路口,地面交通拥挤,地质条件差,施工环境复杂。
1.1地质概况
工程地质情况为杂填土、轻亚粘土、粘土层、粉细砂层;结构拱部位于粉细砂层;结构中部位于圆砾层;结构下半段和结构基础位于粘土或亚粘土层层,以下依次为中砂层、圆砾层。
水文情况:上层滞水位于③粘土层,潜水位于⑤圆砾层,圆砾层中水位标高约24m左右,结构上部位于潜水层,承压水位于结构下部的中粗砂层及圆砾层内,水位标高约为17m左右。
1.2工程结构
车站为分离岛式车站,主体为双线双洞,双层结构。结构断面为单拱单跨断面,标准断面开挖宽度12.6m,开挖高度15.15米;主体结构采用洞桩法施工。断面变化频繁,同时开挖洞室多,洞室距离近,施工难度大。
2、监控量测方案
根据车站的结构形式和地下已有构筑的位置关系,结合洞桩法施工方法及要求,监测采用精密水准仪、铟瓦尺、鉴定钢尺和收敛计,通过精密测量和计算分析预以监控。
3、监测项目
进行日常的常规监测主要有:地表沉降、地面建筑物沉降、倾斜及裂缝、地下管线沉降、隧道拱顶下沉及水平收敛、支护结构内力、临时支护内力、土压力、地下水位、地中土体垂直位移、地中土体水平位移等。
4、仪器选择
采用拓普康DL-101C电子水准仪、拓普康AT-G2水准仪及相应配套铟瓦尺以及经鉴定的钢挂尺(50m)。采用SGS-1型收敛计。
5、测点的布置
暗挖车站隧道以洞内、地表、管线、房屋和桥桩监测为主布点;明挖出入口以地表、管线、房屋和基坑变形监测为主布点。
A建筑物沉降测点布置:在地表下沉的纵向和横向影响范围内的建筑物应进行下沉及倾斜监测,沉降测点埋设用冲击钻在建筑物的基础或墙上钻孔,放入直径200~300mm的半圆头弯曲钢筋,四周用水泥砂浆填实。测点采取保护措施,避免破坏。每幢建筑物上布置4-6个观测点。
b地下管线沉降测点布置:测点重点布设在煤气、给水、污水管线、大型的雨水管及电力方沟上,布置时要考虑地下管线与隧道的相对位置关系。管线沉降观测点的设置可视现场情况,采用抱箍式或套筒式安装。每根监测的管线上最少要有3~5个测点。
c暗挖隧道拱顶沉降测点布置:沿隧道轴线每隔5m埋设1个拱顶下沉测点。埋设方法为在初支钢拱架立好后将拱顶下沉预埋件焊接在拱架上,测点露出喷砼外10~15mm,并进行初测,监测工作要确保连续性。
d暗挖隧道水平收敛测点布置:在拱顶下沉测点同一断面拱腰部位埋设收敛测点预埋件。测点埋设方法为在初支钢拱架立好后即将收敛测点预埋件焊在拱架上,测点露出喷砼外10~15mm,每对收敛点隧道左右两侧各一个,并进行初测。
e初支及内衬结构钢筋轴力测点布置:暗挖隧道的初次支护结构,钢筋计直接布置在钢拱架或格栅拱架上;二次支护结构,钢筋计布置在环向主受力钢筋上。
6、测量方法
建筑物、地下管线沉降监测采用精密水准测量方法。基点和附近水准点联测取得初始高程。观测时各项限差宜严格控制,每测点读数高差不宜超过0.3mm,对不在水准路线上的观测点,一个测站不宜超过3个,超过时应重读后视点读数,以作核对。首次观测应对测点进行连续两次观测,两次高程之差应小于±1.0mm,取平均值作为初始值。
暗挖隧道拱顶沉降监测,由洞外基准点起测量洞内相对基准点高程,再由洞内相对基准点起测量拱顶下沉预埋件高程,通过计算后、前两次拱顶下沉预埋件高程的变化值即可算得拱顶下沉值。施测时前视拱顶测点,倒挂钢尺时底下挂以重物,采用往返闭合量测,同时考虑施测环境的温度,加入尺长改正。
暗挖隧道水平收敛监测,用SGS-1型收敛计按操作步骤准确测量两个预埋件的距离,读卷尺长度和测微计上的读数,然后相加为两测点间的距离,前后两次测量之差即为本次测量的收敛值。
7、监测频率
监测频率决定于变形值的大小和变形速度,频率见表1。
表1 监测频率选择表
位移速度(mm/日) 量测频率(次/日)
μ
0.5
μ>1 2次/日
8、控制标准、警戒值
根据地铁施工经验,对暗挖结构拱顶沉降、净空收敛位移和明挖围护结构变形建立了相应的控制值和预警值。根据本工程的特点、设计要求,并参考有关规范规定,确定本工程施工量测控制值和预警值2。
9、数据分析与处理
现场观测取得第一手资料后,先对观测资料给予整理,校核各项原始记录,检查各项变形值的计算是否有误,剔除错误后,对各种变形值按时间逐点填写观测数据表,然后绘制各种变形过程线,其次对观测资料进行如下分析:
9.1判断实测值的可靠性
对同一物理量进行无限多次量测,即可求得该物理量的真值,但实际工作中只能进行有限次量测,故不能得到真值。但若采用有限次量测的计算平均值作为真值:
式中 N—量测次数;
—第i次的量测值。
则可确定真值(包含99.7%的概率)落在()区间内,是平均值的均方差,为
若以平均值为真值,则误差为。
不过,在隧道工程中往往不能对同一物理量在相同条件下进行多次重复量测。例如,对某断面的拱顶位移,由于开挖的空间效应和围岩的流变特性,客观条件时刻都在变化,上述方法就不适用了。只能采用不同量测手段进行量测,以便相互印证,以确认量测结果的可靠性。设有任意方向的净空变化量测基线ij,显然,对每一条这样的基线,我们都可以写出如下的方程:
式中 —i、j两点绝对位移的水平分量;
—i、j两点绝对位移的垂直分量;
—基线上的收敛值。
根据上式便可将收敛量测所得的数据和用其它方法量测的绝对位移相互验证。
9.2成因分析(定性分析)
是对结构本身(内因)与作用在结构上的荷载(外因)以及观测本身加以分析、考虑,确定变形值变化的原因和规律性。
9.3变形预报和安全判断
实际测得的位移或应力是随时间而变化的,需要找出变化规律,用以判断所设计的支护结构和施工流程最终的可靠性。
由于量测误差所造成的离散性,按实测数据绘制的位移随时间变化的散点图上下波动,难以用来进行分析。因此,需要对量测数据进行处理,找出位移时态曲线。
将实测数据整理成实验曲线和经验公式,隧道工程中较长用的是回归分析法,它的步骤如下:
1、在以时间为横坐标、位移为纵坐标的坐标系中,标出由量测值确定的各对应的实测点,得散点图;
2、根据实测点描绘出光滑的实验曲线;
3、根据所有描绘的实验曲线形状选择回归函数。位移时态曲线都是非线性的,在位移随时间渐趋稳定的情况下,选择函数:
式中的A、B为待定系数,按测量数据,通过最小二乘法求得。
将代入,即可求得A、B,按下式求出回归精度。
求得回归函数后,可以进一步修改原先所描绘的实验曲线。
4、根据回归函数预测最终的位移值():以及,这些值都是稳定性的重要指标。如果位移时态曲线始终保持,说明位移速率不断下降,这是稳定的标志。若出现,说明位移速率维持不变或不断增大,表明围岩进入危险状态。
关键词:数据分析人才;软件工程专业;计算思维能力;正情绪
0引言
Web技术的飞速发展产生了海量的用户生成内容,大量信息蕴藏其中,是潜在用户决策支持的有价值资源。如何挖掘海量用户生成内容催生了数据分析人才的市场需求。麦肯锡全球研究院报告预计,美国在2018年数据分析人才缺口将达到50%~60%,甚至可能更大。我国政府提出的“互联网+”行动计划,使得数据几乎渗透到每一个行业和业务职能领域。在大数据时代,具有丰富经验的数据分析人才需求倍增。
1数据分析人才必备的重要素质
数据分析人才能对行业已有数据进行统计、分析、预测,能为企业经营决策提供科学量化的分析依据。2007年,复旦大学首先在国内开始培养数据分析人才,随后香港中文大学、北京航空航天大学等高等院校也相继开设了相关课程。分析上述高校人才培养计划可知,数据分析人才应该系统地掌握数据分析相关技能(主要包括数学、统计学、数据分析、商业分析和自然语言处理等),应具有较宽的知识面、独立获取知识的能力及较强的实践能力和创新意识,是一种复合型专业人才。《中国大数据技术与产业发展白皮书》在数据人才一章中明确指出,数据分析人才的培养要从本科阶段开始,要注重运用算法分析问题、解决问题,由此可见,计算思维能力是数据分析人才必须具备的重要素质之一。
2计算思维能力培养现状
自2002年以来,我国计算机教育专家将计算思维能力归结为计算机专业人才必备的4大专业基本能力,并且强调计算思维能力是其他3项能力(算法设计与分析、程序设计与实现以及系统能力)的基石。那么,如何在大数据时代背景下,依托应用型本科软件工程试点专业建设,培养软件工程专业学生的计算思维能力,为社会输送高质量数据分析人才?计算思维能力的强弱主要表现为学生能否正确运用抽象与分解、递归、启发式等方法解决计算求解问题。训练学生的计算思维能力可在算法与数据结构以及算法设计与分析课程(以下简称算法类课程)的教学中进行,因而算法类课程是本科阶段培养数据分析人才的重要课程。
然而,在算法类课程的实际教学过程中,存在两个较为常见的问题:
(1)学生理论联系实际的能力薄弱。学生要达到灵活运用算法解决实际问题,必须掌握算法的核心思想,但由于算法类课程中许多概念抽象,一些经典算法较为复杂,在这两门课程的学习和实践中,能体会到理论学习意义和动手实践乐趣的学生很少。
(2)系统能力培养没有受到教师的足够重视。由于算法类课程相关的综合设计课内学时少,教师无法引导学生从系统的角度认知综合设计,并对其进行分析、开发与应用。
由此可见,在算法类课程的现有教学环节中,训练学生计算思维能力的机会较少,必须结合当前数据分析人才市场需求的发展趋势,重新审视算法类课程的定位和内容,以达到夯实学生计算思维能力的目的。
3在算法类课程教学中培养学生计算思维能力的方法
从整体上,一个较高层次的数据分析人才应该掌握7大版块的知识结构,分别是数据采集、数据存储、数据提取、数据挖掘、数据分析、数据展现以及数据应用。以数据分析人才驱动为导向,培养软件工程专业学生计算思维能力的算法类教学方法主要是把算法类课程中算法分析与设计的思想融入数据分析中,用数据分析中的实际需求驱动学生学习书本上抽象的理论知识。以7大版块中最重要的数据挖掘版块作为载体,在算法类课程教学中培养学生的计算思维能力。
3.1基于实际数据分析任务的实验项目设计
目前,国际权威学术组织IEEE International Conference on Data Mining(ICDM)已评选出数据挖掘的10大经典算法:C4.5、k-means、SVM、Apriori、EM、PageRank、AdaBoost、kNN、Navie Bayes和CART。在教学过程中,可以根据不同类型的应用问题,结合这些经典数据挖掘算法布置实验任务,对每一实验任务制定实现该任务的实验目的、实验要求、实验内容、实验步骤和预期实验结果,让学生清晰地理解并实现这些实验任务。
以2013级软件工程专业学生参加中国好创意的“互联网情绪指标和生猪价格的关联关系挖掘和预测”为例,说明实验项目的设计。
(1)实验目的:针对来自国内互联网的生猪历年消费者情绪数据,挖掘消费者情绪指标和生猪价格之间的关联关系。
(2)实验要求:采用Apriori算法,对近期国内五花肉价格及生猪价格进行预测。
(3)实验内容及步骤:首先,对原始的生猪数据清洗是分析消费者情绪与生猪价格之间的关联关系的第一个阶段,其目的是删除无关数据;其次,统计与消费者正面情绪或消费者负面情绪同时出现的相关指标,并根据自定义的最小支持度阈值获得正面情绪或负面情绪的频繁项集;最后,根据自定义的置信度对获得的频繁项集进行筛选,得到有意义的频繁项集。
(4)预期实验结果:解读最终得到的频繁项集,将挖掘的结果反馈到生猪养殖户,让其掌握生猪市场的供求关系。
个别有能力的学生还可以对以上内容进行拓展,从互联网大数据中找出其他一些具有参考价值的生猪价格预测先导指标。
实验任务的编码完成后,还要求学生从软件开发的角度撰写规范的项目报告,内容包括项目的需求分析、总体设计、详细设计、编码与测试等。教师可通过报告清楚了解学生是否有良好的计算思维能力。针对计算思维能力薄弱的学生,教师可以再布置另外的实验项目让其训练。例如,在“互联网情绪指标和生猪价格的关联关系挖掘和预测”实践项目中,要求项目报告中有目标场景、需求理解、方案创意说明、模型数据选取、数据分析、算法设计、实验设计、结果分析、原型系统介绍等。
3.2算法类课程教学内容拓展
由于本科阶段算法类课程的教学内容只涉及完成基于实际数据分析任务的基础知识,不包括数据挖掘算法,这就需要教师在算法类课程中拓展教学内容。因此,在教学过程中需要将经典的数据挖掘算法与算法类课程的理论知识巧妙融合。为此,教师需要详细分析实现每个数据分析任务需要的基本理论知识,然后按照书本相关内容的先后顺序串联起来并编写授课计划,体现算法类课程精华内容与实际数据分析任务的融合。为了保证学生对数据挖掘算法的深入理解,需要鼓励其利用课余时间广泛查阅相关资料,进行自主学习。
在2013级软件工程专业学生参加中国好创意的“互联网情绪指标和生猪价格的关联关系挖掘和预测”竞赛中,指导教师们利用课外时间给学生讲解关联规则挖掘算法的思想、原理、特点等。学生在学习关联规则挖掘算法的过程中进一步掌握了递归与分治思想、回溯法思想;理解了树型存储结构对关联规则挖掘算法性能的改进。通过这样的实践,参赛学生完成的作品清晰展示了他们在学习算法类课程中培养的计算思维能力。
3.3计算思维能力培养的跟踪
为了改进软件工程学生计算思维能力培养中可能存在的问题,收集应用于13级软件工程专业学生的实验项目、授课计划、项目报告、算法类课程的理论成绩与实践成绩。通过跟踪他们毕业设计的完成情况,分析曾在算法类课程上得到较好计算思维能力培养的学生的毕业设计情况,检验提出的方法。由于本研究的对象还没有进入毕业设计环节,故只进行算法类课程的理论成绩与基于实际数据分析任务的实验项目完成情况的分析。通过两门课程期末考试成绩可以看出,认真完成实验项目的学生理论考试成绩普遍高于不认真的学生,这充分说明基于实际数据分析任务的实验项目能有效改进目前算法类教学课程中存在的问题。
此外,还准备通过学院学生管理部门跟踪2013级软件工程专业学生的就业情况和用人单位的反馈意见,了解学生的专业能力,及时修改计算思维能力的培养方法,为探索应用型本科软件工程试点专业建设提供有力支撑。
3.4充分利用移动平台
为了让学生充分体验到算法类课程学习的成就感,在算法类教学过程中,要求学生以3~5人一组,形成一个团队,开发算法类课程教学App。该App的功能模块主要有算法类课程的教学资源、10种经典的数据挖掘算法讲解教案、基于数据分析任务的实验项目、学生作品展示区和交流区。课程结束后,学生对每一个团队开发的App进行互评,最终选用得分最高的课程教学App为下届的学生使用。由于有了这样的平台,教师和学生的沟通变得更加方便与及时,学生对算法类课程的学习不再受时空的限制。在移动终端普及的情况下,这种教学模式一方面能让学生充分利用课余时间,另一方面能营造一种学生之间良性竞争的学习氛围。尽管教学App的开发是学生计算思维能力培养的副产品,但也正是这种副产品给学生带来的成就感让学生在学习的过程中充满了正情绪,让计算思维能力的培养成为一个潜移默化的过程。
关键词:农经专业;数据分析;教学改革
2019年12月,农业农村部、中央网络安全和信息化委员会办公室关于印发《数字农业农村发展规划(2019-2025年)》的通知,部署了用数字化引领驱动农业农村现代化,加快农业农村生产经营、管理服务的数字化改造的发展战略,将全面提升农业农村生产智能化、经营网络化、管理高效化、服务便捷化水平作为农业农村发展的目标[1]。农业农村的数字化建设离不开专业人才的培养。农林经济管理专业毕业生的就业方向主要有农业经营单位、面向农业农村的政府管理部门、事业单位、科研院所等。随着农业农村数字化发展战略的推进,给传统的农经人才培养带来了一系列的挑战[2]。在数字经济和智慧农业的时展背景下,数据分析能力是农经专业学生重要的核心竞争力。如何提升农经专业学生数据分析能力,是农经专业人才培养中面临的重要课题[3]。
1农业农村数字化发展战略给农经人才培养带来的挑战
1.1对农经人才的数据思维的更高要求
在大数据时代,无论是农业生产经营活动,还是农村的行政管理中都有大量的数据资源。农业企业、农业合作经营组织、农产品产销数据、农产品溯源数据为农业经营者提供了生产、物流、销售环节大量的数据资源。经营者需要认识到数据是一种新的生产要素,要调动数据作为生产要素的属性,让数据分析为管理决策服务[4]。在数字中国的建设进程中,各级政府部门工作人员通过各级各部门的行政管理智能,收集了大量省、市、区、县级的区域经济社会发展数据。社区网格化管理下收集了微观层面的农业经营单位数据、农村常住人口数据、医保数据、扶贫数据、农村小额信贷数据。这些数据资源是政府提高行政效率、提高政务服务质量的宝贵资源。
1.2对农经人才的数据分析能力的更高要求
在大数据时代,每天都有海量数据生成,如何能更好地利用这些数据,让数据能发挥其为管理决策服务的功能,与数据使用者的数据分析能力是密切相关的。例如,农业经营单位在农业生产环节的农业投入数据、农产品销售数据、电商平台的客户反馈评论、农产品库存的动态数据,如何整合分析这些数据,要求农业经营者系统掌握数据分析、数据挖掘、文本分析等多元化的数据分析方法。政府管理部门掌握的农业人口的迁移数据、农村常住人口网格管理数据、农村居民医保数据、扶贫数据等,数据类型丰富,数据量庞杂,如何实现数据库的整合,要求政府部门工作人员掌握数据库管理、大数据分析技术。
2农经专业数据分析课程群建设中存在的问题
2.1课程之间连贯性不足
以笔者所在的高校为例,为农经专业本科生开设的数据分析类课程,见表1。数据分析课程群包括了通识教育、专业教育和实践教育。从目前的课程设置来看,涵盖了数据库、统计学、经济计量学、多元统计、大数据分析等领域,内容丰富。数据库应用由计算机学院开设,是一门通识教育课程,在授课时教师往往将其视为一门计算机类的入门课程,在教学中没有针对农经专业学生的特质,将数据库的教学与其在农经领域的应用结合起来。学生在学习中往往会觉得该课程与专业联系不够紧密,教学内容枯燥,缺乏学习兴趣。
2.2学生学习的软件种类繁多,但不够深入
在统计学和多元统计课程中,学生将学习EXCEL、SPSS或者R语言的应用,在经济计量学课程中学生将学习Eviews或STATA的应用,在数据挖掘与大数据分析课程中学生将学习Python语言的应用。在每一门课程中学习的软件都不同,对于软件的学习缺乏连贯性和延续性,虽然学生接触的软件种类多,但是由于学时所限,每一种软件都只是入门级的介绍,无法进入到深度学习。
2.3与专业课学习联系不够紧密,缺乏应用机会
学生缺乏在专业课学习中运用数据分析类课程所学知识的机会。数据分析类课程主要介绍数据分析方法和软件的应用,但大部分都安排在第5学期和第6学期。学生在学习了数据分析方法后,缺少在专业学习领域里运用这些方法的机会。例如学生若要完成产业经济学、农业技术经济学、农产品国际贸易学的专题研究、课程论文,需要用到统计学、经济计量学、大数据分析的方法,但在第2-4学期开设大量专业课的学期,数据分析类课程还没有开设。若能将数据分析类课程尽量靠前安排,学生可以在后续的专业学习、课题研究中运用所学的方法,一方面夯实数据分析技能,另一方面也可以增加学生对专业课的学习兴趣。
2.4排课不够科学
在大三阶段,学生可以选修多元统计、数据挖掘与大数据分析、Python语言三门选修课。但到了大三,学生专业课的学习任务重,选修课种类考虑繁多,学生选课可能出于兴趣、学分安排或者准备考研保研考虑,并不是每一位同学都会选修上述课程。尤其是计算机能力不太强、对数学类课程感到困难的同学,会倾向于选择难度小的课程。
3基于项目驱动式教学理念的数据分析课程群改革
3.1开展项目驱动式教学的意义
项目驱动教学法是基于行动导向的探究式教学方法,是将真实的或模拟的项目转化为教学项目,结合课程内容将项目分解为若干工作任务,创设工作情境,引导学生完成任务,进而实现项目教学目标的教学活动[4-5]。项目驱动式教学法最显著的特点是“以项目为主线、教师为主导、学生为主体”,改变了以往“教师讲,学生听”被动的教学模式,完善了学生主动参与、自主协作、探索创新的新型教学模式。与传统教学方法相比,教学实施过程中,学生的目标更清晰明确,可避免传统课堂教学的被动性,进而提高学生学习知识的兴趣和主动性[6]。在数据分析课程群中引入项目驱动教学,一方面能让学生运用所学的数据分析方法分析现实问题,创设数据分析情境,加深对所学方法的理解和运用,激发学习兴趣,培养自主学习能力;另一方面也可以有针对性地创设围绕“三农”问题的数据分析项目,让学生从数据分析中加深对“三农”问题的感性认识,培养对农经专业学习的兴趣,提升对农经专业的认同度。具体来讲,可以从以下方面开展对数据分析课程群的改革[7]。
3.2统筹规划教学内容,加强课程间的连贯和递进
农经专业数据分析课程群目前主要包括必修课数据库应用、统计学和经济计量学,选修课多元统计、数据挖掘与大数据分析,以及实践课R语言与统计应用、Python语言。统计学教学的重点在于对基础性的统计方法的运用,经济计量学教学的重点在于让学生掌握经济计量分析的范式,如何利用经济计量模型开展实证分析。多元统计强调对复杂多维数据信息的提炼。数据挖掘与大数据分析教学的重点在于大数据时代数据挖掘方法的应用。此外,针对于目前学生所学的软件门类过多,软件操作不够熟练,建议在统计学、多元统计、数据挖掘大数据分析中统一采用R语言进行教学,让学生通过几门课程的学习,能够熟练掌握一种统计分析软件。
3.3基于项目驱动对教学内容进行整合及优化,调动学生主动参与
例如统计学课程介绍了基础性的统计分析方法,在后续课程经济计量学、多元统计、数据挖掘与大数据分析中引导学生运用基础性统计分析方法,对数据进行初步的统计分析和整理,为经济计量分析、多元统计、数据挖掘做好数据处理上的准备,让学生体会到关联课程中所学知识的联结。鼓励学生积极参与“三下乡”活动,开展田野调查实践,围绕“三农”开展调研,运用统计和计量方法对调研数据进行分析,鼓励学生参与到教学中来,培养学生的学习兴趣,学以致用。
3.4建设“项目驱动”实践教学模块
结合农经专业课程体系,建设数据分析课程群“项目驱动”实践教学模块。在农经专业的课程体系中开设的农业经济学、农产品贸易、农村社会学等专业性课程对大量的“三农”问题进行了探讨,这类课程中涉及的城乡差异问题、收入和消费问题、农产品价格波动、农产品贸易等现实问题的研究,都离不开基于现实数据的定量分析。因此,在农经专业的数据分析课程群中可以结合教学内容引导学生对专业课学习中热点问题的研究,围绕课程教学大纲,建设“项目驱动”实践教学模块,理论联系实际,让学生在研究项目中运用所学的数据分析方法,加深对专业知识的理解。
4农经专业数据分析课程群优化方案
在大数据时代,数据分析能力是学生的核心竞争力之一。数据分析类课程在建设中要强调理论与实践的结合,不能只是将教学停留在课堂上,引入体现专业特色的实践教学环节。可以从以下几方面开展数据分析课程群的优化:第一,数据分析基础类必修课安排在大一学年。在第1学期,可以安排R入门、Python入门、数据可视化课程,让学生尽早接触当前主流的数据分析软件,激发学生对R或Python的学习兴趣,让学生自我拓展学习空间。R入门、Python入门、或者数据可视化课程都属于数据分析的基础课程,无需其他先修课程。在这一时期,让学生开始接触数据分析软件,学习数据可视化的分析工具,有利于培养学生的数据思维、数据意识和软件实操能力。第二,将与农经专业课有关的专业必修课统计学、经济计量学安排在第3-4学期学习。统计学课程需要学生先行修读高等数学和概率论课程,经济计量学需要学生先行修读微观经济学、宏观经济学,因此可安排在第3-4学期。让学生在掌握了一定经济管理专业知识后,可以更好地体会统计学、经济计量学方法论学科的应用价值。第三,将数据分析进阶类选修课多元统计、大数据分析、数据挖掘、机器学习等课程安排在第5-6学期。为高年学生提供丰富的数据分析类选修课,让学生结合自己的兴趣、未来的发展规划学习更加多元化的数据分析技术。鼓励学生能在专业论文习作、学科竞赛中有更多的机会运用自己所学的数据分析方法,增加学生的收获感和成就感,挖掘学生的学习潜力。第四,改革课程考核评价体系,采用项目式管理和评估的思路,由学生自主开展一个数据分析项目,从收集数据、提出问题、分析数据到提炼研究结论,开展小组团队成员互评。教师跟踪学生的项目开展过程,从学生的学习态度、投入程度、数据分析质量等综合评价学生的学习效果。
5结束语
将项目驱动教学引入到农经专业数据分析课程群的建设,让学生参与到教学中去,突破传统教学中“教师教学生学”的局面,让学生通过参与项目,运用数据分析方法解决项目中的实际问题,激发学生的学习兴趣和潜能,让学生体会到所学知识的应用价值,让学生不再对数据分析类课程望而生畏。本文的研究对于农经专业学生数据分析能力的培养有重要的意义,强调理论与实践的结合,提高学生数据分析的高阶能力,也能为同类课程开展项目驱动教学提供借鉴。
参考文献:
[1]农业农村部中央网络安全和信息化委员会办公室关于印发《数字农业农村发展规划(2019-2025年)》的通知[EB/OL].(2019-12-25)[2020-4-14].
[2]李虹贤.农业经济管理专业人才培养模式创新研究与实践[J].智慧农业导刊,2022,2(7):110-112.
[3]冯开文,陶冶.农业经济管理专业实践教学改革———以中国农业大学经济管理学院为例[J].教育现代化,2017,4(23):54-56+63.
[4]杜洪燕,陈俊红.乡村振兴背景下中国数字农业高质量发展路径研究[J].南方农业,2021,15(21):213-214.
[5]金娥.基于项目式学习的《现代教育技术应用》课程学习框架的设计与实践研究[D].武汉:华中师范大学,2021.
[6]胡静,王昌凤.基于应用型本科人才培养目标的项目式教学模式构建[J].教书育人(高教论坛),2022(9):59-64.
【关键词】数据分析观念;价值要义;培养策略
【中图分类号】G623.5 【文献标志码】A 【文章编号】1005-6009(2017)33-0035-03
【作者简介】1.周丹菊,江苏省淮安市天津路小学(江苏淮安,223005)总务副主任,高级教师,淮安市数学学科带头人;2.王乃涛,江苏省淮安经济技术开发区教师发展中心(江苏淮安,223005)教研员,高级教师,江苏省数学特级教师。
在大数据时代,海量信息从数据中产生,具备数据分析观念和能力是信息社会对人的基本要求,是数学素养的重要方面。新课标把“统计观念”修订为“数据分析观念”,点明了统计的核心是数据分析。对数据的搜集、整理、分析并体会事件发生的可能性、随机性,培养学生数据分析观念,帮助学生进行合理判断和科学决策。
一、以信息为载体,让数据“发声”――培养数据分析观念的初意识
1.数据场景现实化,激发数据整理的兴趣。
儿童更容易对现实的东西感兴趣,尤其是数据分析观念很薄弱的低年级儿童,教学需要根据儿童认知规律和心理特征,创设现实化场景,调动其整理数据的欲望;通过简单的分类整理等活动,让学生初步了解数据,理解数据中蕴含的有价值的信息,培养根据问题收集、获取、分析数据的意识。
案例1 苏教版二下《分类统计》
(图1)
问题1:图1中有哪些人,分别在做什么?你还想知道什么?
生1:我想知道学生比老师多多少人?
生2:我想知道参加哪种活动的人最多,哪种活动的人最少?
以上是儿童第一次接触统计教学内容,面对游戏情境图,大多数儿童只知看图说话,并没有意识到主题图中隐藏的数学信息。因此,笔者让儿童谈谈“你还想知道什么”,以此来激发他们收集数据的兴趣,并使他们意识到,必须根据问题情境对数据进行分类和整理。这是培养学生数据分析初意识的方法之一。
2.数据表达个性化,彰显数据分析的意趣。
在现实场景中,教师无法预设学生整理数据时会运用哪种符号或方法。首次进行数据整理的儿童往往会创造出令人意想不到的符号,教师应尊重其思维特点,保护其创造性。
问题2:要想知道学生比老师多多少人,你准备怎样分类?有什么好方法能做到不重复,不遗漏? 小组合作:用自己的方法表示分类的结果。
部分呈现:
分析:根据整理出的数据,能解决你提出的问题吗?你还能从这些分类结果里知道什么?
放手让儿童收集、整理数据,鼓励他们用自己的方式记录并呈现数据,儿童从场景信息到符号数据的整理过程中感受到数据分析的乐趣。
二、以问题为导向,让过程“发生”――激发数据分析观念的潜意识
1.问题指向富有统计意义,经历真实过程。
培养儿童数据分析观念不能一蹴而就,须让儿童从亲身经历中获取、感悟,让他们不断经历数据分析的全过程:调查收集整理分析。根据数据分析的结果,儿童作出预测和决策,感悟分析过程中渗透的分类、归纳、类比等数学思想方法,数据分析观念从而得以发展。
案例2 苏教版四上《可能性练习》
问题:按照足球比赛的国际惯例,双方采用抛硬币的方法决定谁先发球。瓶盖也有正反两面,为什么不采用抛瓶盖的方法呢?
活动:合作抛硬币、瓶盖各10次并记录结果。
交流:瓶盖开口面朝上与朝下的次数相差比较大,硬币两个面朝上的次数接近。
分析:瓶盖两面轻重不一样,落地后两面朝上的可能性不相等。硬币两面轻重是一样的,落地后两面朝上的可能性相等。所以,抛硬币的方法对双方来说是公平的。
儿童在有价值的任务的驱动下经历主题式活动,亲身经历了数据统计的全过程,统计方法得到掌握,数据分析观念得以发展。
2.大数据问题分析多样化,渗透多元思想。
大数据收集、分析过程可以多元化。根据问题所需,选择适切的分析方法是培养数据分析观念的关键。
案例3 苏教版六下《统计与可能性复习》
问题:利用网络调查统计全校各班男生、女生喜爱文艺、科技、漫画、故事等四类图书的数据。
交流1:展示某一年级学生喜爱文艺类图书人数情况可用什么统计图?展示某一年级男生、女生喜爱漫画类图书人数情况可用什么统计图?
交流2:展示全校各年级学生阅读故事类图书的喜好变化情况用什么统计图?展示全校学生喜爱阅读各类图书的分布情况用什么统计图?
基于全校的调查样本,教师引导儿童对收集的数据进行整理分析,在讨论中让儿童明晰统计图表的选择是基于能否解决所要分析的问题,在讨论中,儿童将感受到数据分析的魅力。
三、以课程为资源,让数据意识常态化――拓宽数据分析观念的广意识
1.开发有价值的材料。
并非只有统计教学可以培养学生数据分析观念。图形的认识、质数、圆周率等知识的学习,也能培养学生数据分析观念。
案例4 苏教版一上《认识图形》
(1)小组活动:每人选一种积木看一看、摸一摸,把自己的感受和发现在小组内交流。
(2)分一分:把相同形状的物体放在一起,说说为什么这么分。
引导儿童把随意摆放的各种图形进行分类,儿童既认识了图形又经历了数据整理的过程。适时创造、开发有价值的研究材料可以把培养学生的数据分析观念贯穿于课程教学的始终。
2.依托教材体验随机。
稻莸乃婊性是数据分析观念的要素之一。在课程内容教学中,紧扣教学内容,通过个别现象了解整体规律,由特殊认识一般,可以培养学生的创新精神。
案例5 苏教版五下《圆的周长》
问题:圆的周长和直径到底有什么关系呢?
活动:以小组为单位,测量手中的4个圆(每组领到的圆相同),记录测量出的周长、直径的长度,利用计算器算出圆的周长与直径之间的关系,填入表格。
反馈:选取多组数据进行分析,讨论周长除以直径的商有什么特点?为什么有的组测量同一个圆,数据会不一样?
“圆的周长与直径到底有什么关系”问题旨在激发儿童通过数据分析获得结论的意识。让儿童思考为什么不同的小组测量同一个圆,得出的结果不同,儿童很快意识到测量数据是有误差的,而产生误差的原因是多样的,这正是事件发生随机性的原因之一。儿童在对多个圆的周长除以其直径的商的数据分析过程中,发现周长都大约是直径长的3倍,这是事件随机性的另一个重要方面。
四、以实践为决策依据,让数据分析生活化――实现从数据分析到解决问题
1.拓展数据分析路径,提升问题解决能力。
一方面教材提供了大量培养儿童数据分析观念的素材,另一方面解决生活中的实际问题有助于儿童真正养成数据分析观念。因此,儿童数据分析观念的培养需从课堂延伸到课外。
案例6 “快乐的联欢”活动准备
谈话:同学们,“六一”儿童节马上就要到了,班委会打算买些水果分给大家吃,他们该如何购买?
交流:调查大家最爱吃的水果再作决定。
分组收集,汇总全班数据:18人爱吃西瓜,3人爱吃苹果,6人爱吃梨,25人爱吃桃子。
得出:根据大家爱吃的水果种类和数量买水果,但是西瓜体积大,不必买这么多,买2个就可以了。
当数据分析真正走进学生的现实生活,学生亲身经历了解决实际问题的过程,才能真正体会数据分析对决策的作用。学生能结合实际考虑个别样本的特点,思考问题更加全面,数据分析观念得以发展,解决问题能力得以提升。
2.延伸数据分析场域,养成自觉自主意识。
互联网时代的学习方式是多元的,“数字化教学”已经走进课堂,海量互联网信息提供了丰富的数据分析素材。
案例7 “一起作业”网络学习
(1)学生登录校园英语学习网站,完成单词跟读、拼写、排序、模仿、连词成句等学习项目。
(2)通过每天的统计数据,了解自己的作业情况,对照本班实际完成情况分析在班级中的排名,也可进行班与班之间的对比。
数据分析素养的养成是为了使学生能更好地适应未来的学习、工作和生活。本例中,学生可以从统计表中了解自身的学习时间、效率、效果等,对自己的学习状态进行定量或定性的评价。教师也可以分析个人、班级、年级间的差异,为评价学生提供依据。延展性学习,提升了分析数据和解决问题的能力,有助于在“大课堂”中发展学生数据分析观念。
【参考文献】
[1]教育部基础教育课程教材专家工作委员会.义务教育数学课程标准(2011年版)解读[M].北京:北京师范大学出版社,2012.
关键词:大数据分析;高中数学;教学策略
一、引言
在大数据的影响之下,我们的传统的教育教学方式正在发生着剧烈的改变,大数据分析在教学中的应用也越来越明显,特别是在高中数学中的应用,未来的大数据分析必然会对教学产生巨大的作用,因此,研究大数据分析是一件至关重要的事。
二、大数据分析的概念
对于数据的本身来说,是用来记录信息的,但是随着计算机和互联网技术的发展,我们在生产和生活中的各个领域都有了突飞猛进的进步,这相应地带来的是各种数据的处理方式更加的复杂,数据的数量以及涉及的规模也在不断地扩大。大数据的特点可以和经济学的观点一样,从微观和宏观两个方面来理解,但是目前大多数对大数据有研究的专家来说他们都是从宏观的角度来分析大数据的定义的。大数据处理的数据数量很多,即使新数据也能很快地进行处理,这些数据的类型也是多种多样涉及很多的领域,而且处理的数据具有真实性。大数据分析的重点在于分析,就是利用大数据技术对收集到的数据进行全方位的分析,大数据分析的优势明显,哪怕你的数据量非常大,但是分析也能快速地完成,并且还能保证数据的真实性。大数据分析的目的是通过对历史数据的分析和解决,进行科学的总结,发现其规律性和模式,同时结合稳定的动态流数据预测事物发展的未来趋势。
三、高中数学课堂教学策略的大数据分析
(一)更新高中数学教学思想,以此构建数据分析的概念。很多的老师因为受传统的教学观念的影响,思维方式和教学方法都已经模式化了,并没有树立数据分析的教学观念,俗话说,物质决定意识,意识是物质的反映。如果老师的教学观念还没有及时更新的话,那么,教学行为在这些思想的影响下还是不会出现根本性的变化,为了解决这一难题,在国家新的课程改革中明确提出了“数据分析”这一概念,这一概念的提出标着在大数据的时代背景下我们的国家也越来越重视数据分析在教学中的实际运用,各位老师应该牢牢把握住数据分析的观念,在实际教学中,帮助学生构建数据分析的知识框架。(二)勇于探索,在数学教学中尝试分层教学。现在的高中数学教学的过程中,采用的还是以班级为单位的固定的教学方法,这种教学方法已经是一种既定的模式,对知识接受不同程度的学生他们上课的内容是相同的,这样接受能力强的学生的潜能得不到发挥,接受新知识能力弱的学生跟不上老师讲解的内容,打击了他们学习的积极性和主动性。早在几千年之前,我们的大教育家孔子在教学的过程中就提出了因材施教的教育理念,要求老师在课堂教学中准确地把握每一个学生的性格特点,来进行知识的传授,不错过任何学生的潜力,同时进行不同类型的教育。在高中数学课堂教学中,教师可以分层次地教学生。一班上有不少学生,学生与学生之间存在个人和个人之间的差异,不同学生的不同类型的教学可以有效地促进教学课堂。个人差异和个体差异明显的小学生,也可以尝试不同的教学方法,尝试新的教学模式,面对个人差异,分不同层次的分析教学给他们,这有助于促进学生更好地学习数学,也充分挖掘学生在数学上的潜力。(三)学习分类和重视数学知识的积累。高中数学是一个强大的抽象性和逻辑性的学科,需要有更大的知识量,这就要求学生学会分类,分类各种数学知识,这有助于学生加深对数学知识的理解,也可以帮助学生理清数学知识的静脉,学生进入下一阶段的数学学习会学得更好。另外,还要强调数学知识的积累。
作者:冯雄德 单位:武威第七中学
参考文献:
[1]宋显微.高中数学课堂教学研究[J].亚太教育,2016(14).
[2]贾慧梅.基于云平台的初中数学课堂教学研究[J].中国教育技术装备,2015(23).
[关键词] 初中数学;数学课程标准;数据分析观念;数学素养
一、初中生培养数据分析观念的意义
课程标准认为数据分析观念主要指:在现实生活中处理问题时先做调查研究,收集到有用的数据,分析数据中蕴含的信息并以此为依据做出判断;掌握解决问题的多种方法,能根据问题或实际情况选出合适的方法;体验数据分析中的随机性,在足够的数据中发现规律。[1] 也就是说在数据分析观念的指导下,学生能够用适当的统计分析方法对收集的大量数据进行分析,提取有用信息或形成结论,从而对数据加以研究和概括总结。观念指导实践,培养学生的数据分析观念就是培养学生形成有效的问题解决策略,在数据中发现价值从而指导决策。数据分析观念的形成需要学生经历数据统计分析的全过程,包括调查研究,收集、整理、分析数据并做出预测和决策,再进行交流、评价与改进,进而形成对数据处理的思维。
二、初中生数据分析观念现状
课程标准将原来培养学生“统计观念”的目标改成如今的培养学生“数据分析观念”,是为了让学生对数据有一个宏观的把握并能利用数据分析观念解决问题。而学生,甚至是一些教师,没有意识到概念的转变意味着学习方式和教学方式的转变,仍然以升学考试各知识点的占比作为学习的主体,为学习而学习,为升学考试而教。教师应该利用教材的系统性安排,为学生合理设计教学计划,以培养学生的数学素养和数学能力为最终目的,唯此才能从根本上提高学生的数学学习能力。
学生的数据分析水平一定程度上反映了数据分析能力。据调查统计,[2] 不具备数据分析观念的学生和能够建立数据表征但不明白目的和作用的学生占调查的初中生一大半。教师因为过于注重对频率和概率的概念性教学,使学生不能够正确认识频率与概率的关系,也不会从数据分析中找到规律。学生数据分析水平不高的原因主要是教师在教学中重计算、轻体验,重讲授、轻探究,重得分、轻能力,重结果、轻过程。[3]
三、课堂培养策略
1.提升学生兴趣
培养学生的数据分析观念,要让学生主动参与课堂学习。教学中适当地使用情境教学法,将生活实际问题转入数学知识的教学中,能够激发学生的探究欲望,促进学生建构数学知识体系和迁移知识。情境的设置可以包括对天气预报的准确程度进行预测、商场打折促销活动的折扣程度,甚至是银行存款利率变动的原因分析等,依据学生的知识掌握情况和课程进度向学生抛出与日常生活,与民生息息相关的事件,引发学生关注,学生在教师指导下认识到数据分析给解决这些问题带来的便利。
随着教学的深入,学习难度提升,教师情境教学方式要让学生进入到对数据分析的体验过程中,亲历数据的收集、整理、处理、分析和做出判断,在体验中形成数据分析意识,提升数据分析能力。例如,对“随机事件”的教学,教师提出骰子抛掷后正面朝上的点数的可能性,先让学生提出自己的观点,然后教师给学生骰子让学生分成若干小组自己尝试抛掷10次、20次、30次甚至更多次并将每一次结果记录下来。抛掷完骰子后,教师让学生汇总数据并汇报6个面分别朝上的次数占总次数的比例,接着将每个组得出的结果展现给学生,学生会发现结果不尽相同,汇总所有小组的结果后,不同点数分别朝上的占比还是可能与所有小组都不一样,由此引出随机事件的概念。学生通过这一过程体验到数据的收集、整理、处理过程,形成处理问题通过数据来做出判断的意识。
2.掌握数据辨别能力
数据分析是个应用性较强的活动,日常生活中经常要运用到各种数据分析,但怎样在众多数据中提取有效信息为我所用,学生对此还很不清楚。因为不管学习还是做题时,经常是给出的数据都是有用数据,没有其他数据掺和进来混淆对数据的分析活动,可现实生活中,同一个事件产生的数据不止一种。这就需要教师留意培养学生理智选择数据进行分析的意识,对数据抱有质疑态度,才会深入数据的形成过程,理解每一组数据代表的信息。
例如,给出一组数据:65、72、60、65、88、90、70、65、65,假设是某班一次考试成绩,教师向学生提问:如果要分析学生的整体水平,要怎样利用这组数据呢?不少学生可能认为计算出所有成绩的平均数就是这次考试的整体水平,而这个平均数约为71分。这时候教师可以让学生思考:平均分71分和占了全部数据的4/9的65分哪个更能代表这个班的总体水平呢?由此引入“众数”的概念――一组数据中出现次数最多的数值,叫众数,并且让学生认识到,平均数与众数都是对整体数据进行分析,但平均数是反映数据的总体平均水平,而众数则反映数据的多数水平,虽然用以代表数据可靠性相对差一些,但它不受极端数据的影响,求法简便,适用于大面积的普查研究或非数值型信息。通过这样的教学设置,学生既学到了新的知识点,同时也掌握了在不同数据和问题中辨别数据、利用数据的能力,在面对数据时,能有意识地辨别、选择有用数据。
3.强化分析能力
教学中教师经常花更多的精力让学生读图作分析,忽略了让学生知道并掌握这个图表要在什么诉求下形成,什么情况下用别的图表形式来呈现数据。而让学生会选择合适的方法分析数据,能更直观地显示数据分析结果,有助于提升判断的准确性。教学中可以引导学生体验在同种数据下各种图表的产生和形成过程,比较数据分析方式的差异,找出最优数据分析方法,提升数据分析观念。
通过让学生对比各种类型图表,学生会发现,柱状图比表格呈现稍微直观一些,而折线图比柱状图对波动的表现更为直观。比较柱状图和折线图,会发现柱状图较容易比较数据之间的差异,而折线图在表示数量多少的同时,还可以反映同一事件在不同时间的变化情况。这种体验分析,提高了学生辩证思考和分析问题的能力,学生能够建立起在不同需求下分析处理数据的观念,并知道如何选择分析方法,然后依据数据的趋势进行预测并给出合理建议。
4.课后锻炼策略
观念的形成不能一蹴而就,数学思维能力需要在不断的锻炼中获得提升,使能力得到提高进而促进良好数据分析意识的形成,而良好的数据分析观念能推动向应用能力的转化。实际生活中有太多可以让学生发挥数据分析意识去解决的问题,教师对学生的课后作业可以不用局限于教材教辅提出的练习,而是让学生自主选择一个主题,自己亲历提出问题,收集、筛选、分析数据并得出结论的过程。例如,对学生每天放学后从学校回到家的时间进行统计分析,调查身边同学所喝矿泉水的品牌,看篮球赛时对不同队员的投篮次数进行统计并分析等等。相比于埋头在习题中,这些有趣的观察记录活动更能吸引学生的兴趣,发挥主观能动性去参与,也有利于培养学生全面、客观、务实的数据分析意识。
参考文献
[1]中华人民共和国教育部.全日制义务教育数学课程标准[M].北京:北京师范大学出版社,2011.
[2]张宁.初中生数据分析观念发展水平及教学成因研究[D].重庆师范大学,2013.
[关键词]会计信息管理;人才培养;数据分析
0引言
2012年以来,铺天盖地的大数据进入了我们的视线,各种流行书籍,各大网站、媒体都在谈论大数据,一时间成为这个时代最热门的话题。同时,这也引起了我们的关注。我们说,大数据,不单纯是数据规模上的大,还在多样性、速度、精确性上都有突破性增长。更重要的是,这种数据的潜在价值也是旧有数据难以企及的。我们这里暂且不论如何驾驭大数据以及有什么样的技术要求,它给我们的一点重要启示就是要注重数据分析的重要性。在此背景下,深圳信息职业技术学院会计信息管理专业积极探索满足新形势下人才需求的培养模式,使人才更好地满足当前企业的实际需要。
1大数据时代背景引发对人才需求的变革
可以说,在未来的竞争领域,“占领市场必须先占有数据”,也就是要做到基于信息的决策———“用数据说话,做理性决策”,即进行数据分析。数据分析是从海量的数据中提取和挖掘出对企业有价值的规律和趋势,为企业的决策提供支持,这些支持体现在四个方面:①行为预见镜———帮助企业识别机会、规避风险;②问题良药———帮助企业诊断问题、亡羊补牢;③跟踪检测———帮助企业评估效果,提升效益;④引力动力器———帮助企业提高效率,加强管理。不可否认,个别公司的决策人具有超人的战略眼光以及敏锐的洞察力,单靠直觉也能给公司带来巨大价值。那么究竟靠数据分析的决策能否优于直觉决策,我们这里也要靠数据说话。有学者比较了组织中用直觉决策以及用数据分析决策的可能性,研究发现,业绩优秀的组织更多地倾向于采用分析决策,尤其是在财务管理、运营、战略等方面。因此,可以推断,用数据分析决策比直觉决策能给企业带来更大的价值。与此同时,根据智联招聘网站显示,短短两年时间,珠三角地区数据分析人才需求已接近了需求量旺盛的传统会计专业。可见,越来越多的公司需要能够对公司财务等相关信息数据进行处理、加工、分析以为公司管理层决策提供信息支持的人才。可以说,传统会计专业注重会计核算,即财务报表编制的整个流程及环节的掌握,而会计信息管理专业更注重对财务报表数据以及其他有用信息数据的再加工、处理、分析及呈报,以满足管理层经营决策的需要。可以说,不同的社会发展阶段和发展水平要求有不同的专业设置及专业培养目标与之适应。从会计电算化到会计信息管理背后的推动力是时代的变革引发的对人才的需求。然而,从当前会计信息管理专业的建设情况来看,多数院校存在培养目标不清晰、没有明确的专业定位、与会计电算化等专业没有明显区分以及缺乏明确的专业核心课程等突出问题,尤其是对会计信息管理专业名称中“信息”二字究竟如何体现没有清晰的把握和界定。因此,会计信息管理专业的人才培养模式亟需变革。
2大数据时代背景下会计信息管理人才工作岗位及能力分析
深圳信息职业技术学院2012年成功申报会计信息管理新专业,并于2013年下半年开始首届招生。与此同时,会计信息管理的专业定位、培养目标、课程体系也成为摆在专业任课教师面前的重大课题。近几年来,全体专任教师围绕会计信息管理专业建设展开了一系列的咨询、调研、走访,并定期进行讨论、交流,扎扎实实了解实际中的人才需求,实现专业人才供给与人才需求无缝对接。到目前,初步形成了具有专业特色的会计信息管理专业建设思路与方法。首先,会计信息管理专业人才就业岗位主要集中在账务处理、管理会计、财务数据分析、预算管理、成本管理、资金管理及内部控制等方面。具体工作任务体现在:会计核算,纳税申报,管理会计,财务数据处理、加工、分析及呈报,以及预算、成本、资金管理等。其次,在新形势下会计信息管理人才的工作岗位领域,会计信息管理专业人才应具备如下三方面能力:①会计核算能力,指的是熟悉并掌握会计信息生成系统,运用财务信息对企业经营活动进行评价;②数据分析能力,指的是掌握一定的数据分析方法,运用Excel、数据库等现代信息技术手段对数据进行采集、处理、分析及呈现;③辅助决策能力,指的是能够依据相应的数据分析结果,为公司日常财务等管理决策提供支持。
3大数据时代背景下会计信息管理人才培养目标
在当前互联网时代及大数据时代,对财务人才的要求,已经不局限于传统账务处理,更倾向于对决策相关信息数据的处理和分析。“占领市场必须先占领数据”,公司财务和经营决策的制定更多的是基于信息的决策,即“用数据说话,做理性决策”,而数据分析即是从海量的数据中提取和挖掘出对企业有价值的规律和趋势,为企业的决策提供支持。因此,在新形势下,会计信息管理专业的人才培养目标可以确定为数据分析引领财务决策信息化。为了实现这一培养目标,需要三个层面的支撑体系,即基于财务会计、强化数据分析、服务管理决策。
4大数据时代背景下会计信息管理人才培养课程体系
在以数据分析引领财务决策信息化的人才培养目标指引下,我们初步形成了如下三个层次的课程体系。
(1)会计学基础课程:会计信息管理源于会计,不能脱离财务会计,仍然要以财务会计为基础。专业学生要了解财务报表的生成过程及会计账务处理流程、能够对一般企业常见经济业务进行会计处理、进行企业纳税申报等。这方面课程主要有:会计学原理、财务会计、纳税实务。
(2)数据分析技术课程:对信息的把握体现在两个层面,其一是与企业信息化相适应的一般管理软件、财务软件的使用及熟练操作以及简单维护,能够作为关键人物辅助中小企业实现财务信息化;另一层面通过对数据的采集、整理、分析报告,满足管理层基于信息的决策以及决策的科学化。数据的来源可以来自公司内部的管理信息系统,根据需要也可以来自企业外部的国家经济产业政策、行业市场信息等。其中,对数据的分析能力又从两方面进行培养,一方面是分析思维方式的培养,这是起主导作用的层面;另一方面是分析工具运用的培养,信息化时代,数据量的加大要求借助于一定的分析工具才能实现数据分析。企业信息化实施及数据分析方面的主要课程有:财务报表分析、财经数据分析、应用统计学、数据库原理及应用、数据处理软件应用、商务智能等。
(3)决策能力提升课程:新形势下财务人员面对和服务的更多是企业的管理层和决策层,会计信息管理专业学生要清楚公司管理层和决策层需要哪方面的决策信息支持,并通过数据分析方法进行提供,同时给出合理化建议。这方面课程主要有:管理会计、财务管理、成本管理等。其中,财经数据分析课程能够使学生掌握系统的数据分析方法,包括数据收集、数据处理、数据分析、数据展现及报告撰写各环节的基本理论及操作技能,同时熟练地运用数据分析的思想和方法分析企业的财务数据,为管理层决策提供信息支持。数据分析软件应用课程能够让学生熟练运用Excel等常见数据分析工具、软件进行数据录入、数据整理和数据分析的方法和技巧,培养学生操作Excel等数据分析软件的基本技能。商务智能(含数据挖掘)课程依托商务智能平台,从商务智能概念、商务智能结构、多维数据集内容、数据挖掘、交付等主要内容,使学生在了解如何运用商务智能的工具、架构以及规则的基础上,分析企业数据,为企业管理层提供信息化决策支持系统。
5结语
不同的社会发展阶段和发展水平要求有不同的专业设置及专业培养目标与之适应。从会计电算化到会计信息管理背后的推动力是时代的变革引发的对人才的需求。大数据时代下会计信息管理人才培养目标为数据分析引领财务决策信息化。相应课程体系为财务会计基础课程、数据分析技术课程、决策能力提升课程。我们共同期待,会计信息管理人才将通过数据分析对企业财务等管理决策带来价值增值。
主要参考文献
[1]陈宪宇.大数据时代企业相关职位设置与人才培养[J].经营与管理,2014(9):43-47.
[2]谭立云,李强丽,李慧.大数据时代数据分析人才培养的思考及对策[J].黑龙江科技信息,2015(3):57.