时间:2023-06-06 09:01:49
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇人工智能专题,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
一、人工智能
人工智能(Artificial Intelligence,缩写为AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它试图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。养老服务业人工智能的应用主要体现在家居扫地机器人、语音沟通服务、家庭体检、药物使用建议、家居厨师、家居智能陪伴服务。
二、养老服务人才培养“人工智能化”
人工智能上升为国家高级战略后,国家发展服务性制造和生产性制造,同时尽可能的通过服务业的再造和完善,改进我国经济产业结构,发挥技术、人才、产业的对接联动效应。人、机器、智能机器将共生共存,成为养老服务工具的新常态。未来的养老服务人才不是笨干、累干、苦干,而是实干+巧干,实现脑力劳动的智能机械化,尽可能地减少人力的倦怠感,提高服务效率、质量和速度。智能化,体现在养老服务人才应具备传播人工智能基础知识,客观了解人工智能,有效实现人与机器、智能机器的有效配对组合应用,充分发挥智能机器的保健医生、保姆、玩伴、老伴、子女多重功能,倡议自养老。
三、人工智能养老服务人才培养模式
(一)广播电视大学远程教育模式――音像媒体
配备养生、人工智能国内一流专家,发挥国家音像媒体的作用,将人工智能家居应用的途径、方式、手段通过网络微视频的形式进行普及。发挥社区教育指导中心、社区大学和社区教育学院、社区学校、社区学习站四级社区教育办学网络体系的作用,建立社会养老大学,使老年人自己会应用人工智能,减低对子女的时间依赖。
(二)公众号社会宣传普及模式――微媒体
国家、企业、社区应建立专题公众号进行微媒体培训。从国家层面,要建立人工智能养老服务应用技术发展历程方面的公众号;从企业层面,要建立人工智能机器人养老服务应用说明类的公众号;从社区层面,要基于一些鳏寡孤独建立社群委托服务型人工智能服务策略的公众号。
(三)职业技术学院培训模式――专题高端培训
目前,人工智能服务还不能完全普及,故而职业技术学院的后备人才首先要建立自我提升的潜意识,此外,职业技术学院自身要引进国内外的人工智能专家,进行家庭陪护、游戏娱乐、医疗、做饭、洗衣、洗漱、保健、锻炼等多重人工智能方面的高端培训。
(四)民政部门、老龄委联合推广模式――社会传媒
作为养老服务的主管部门,民政部门和老龄委要利用广播、电视、报纸、杂志等对人工智能的发展趋势、前景、作用、功能、效益、方式进行宣传。民政部门要侧重于养老服务的社区组织协调,老龄委要侧重于制度、规定、采购人工智能机器方面的政策优惠的制定。
(五)社会民间家政服务组织培养模式――养老院、福利院自组织模式
民间社会力量建立有养老院、福利院,这就对相关服务人员的素养提出了时代性的要求。其一,人的社会角色多,时间、精力、体力有限;其二,人工智能是趋势,必须适应并学会使用;其三,要加强前瞻性人才培养,解决劳动倦怠问题,即民间组织自己解决自己的问题,通过人工智能,减少雇员,降低劳动力雇佣成本。
四、人工智能养老服务人才培养对策
(一)广播电视大学养老服务人才培养对策
依托远程教育系统,发挥网络平台的作用,将人工智能的技能培训与社区教育、社会养老大学的建设并举;发挥广播电视大学的社会服务功能,与人工智能机器生产企业搭建战略伙伴关系;积极推进产培用一体化建设,形成网络平台特色模块;推出广播电视大学养老服务精品课教程,以优质教育品牌打开培训窗口。
(二)人工智能机器制造企业养老服务人才培养对策
基于居家养老的社会需求利益取向,把脉居家老人和其子女的时间要求,积极开发、完善人工智能机器的特殊功能,加大资金投入力度,特别加强对情感交互、图像识别、语音功能的完善;重点做好人工智能机器使用说明,要具有便捷实用性的操作指南,方便人们学习。
(三)职业技术学院养老服务人才培养对策
职业技术学院作为专职教育机构,首先,要提前与职业高中接轨,进行专职意向高中生的录取,为养老服务人才培养获取意向生。其次,要突出人才培养的实践应用性,购置高端智能机器,让学生能够迅速掌握技能,并且能够进行社会的二次培训,对购置的智能机器进行租赁和应用培训。
(四)民政部门、老龄委养老服务人才培养对策
民政部门和老龄委要培养高级管理人才,建立养老服务人才智库,积极推进国家、企业、社会的养老服务人才人工智能化联动培养;加大对家庭贫困并且有意向致力于养老服务的青年才俊的培养支持力度;对人工智能养老服务高端研发海归人才给予政策优待;建立城市养老服务专家群组,定期召开学术研讨会议,增进智慧交流。
(五)社区养老服务人才培养对策
社区要加强人工智能养老服务人才的典型宣传,利用宣传画的形式传播人工智能应用的优势;积极打造人工智能特色服务团队,开展社区公益性专题培训,并募集资金购置人工智能机器为特殊群体献爱心;努力构建人工智能养老社区,采用人工智能的形式鼓励老年人进行文体娱乐,增强体质。
总的来说,在计算机技术不断发展的现代社,人工智能技术的普及给养老服务带来了巨大的便捷。随之而来的人工智能化养老服务人才的培养成为了发挥人工智能养老服务效用的关键环节。要培养人工智能化养老服务人才,可以从远程教育、社会宣传普及、学院培训、政府推广等模式入手,实现人工智能化养老人才培养模式的多元化。同时,开展远程教育的过程中运用产品一体化模式,在满足老人需求的基础上提升人工智能设备的人性化操作,重点开展职业技术院校的人才培养方式,与民政部门开展紧密合作,积极培养人工智能化养老服务人才。社区方面强化人才的教育宣传工作,全力搭建人工智能养老社区。
【关键词】全国“两会” 新媒体 报道模式 人工智能 大数据 虚拟现实
【中图分类号】G220 【文献标识码】A
2017全国“两会”中,新媒体报道手段精彩纷呈,全国各家主流媒体由技术精湛、经验丰富、新老搭配的编辑记者组成融媒体报道一线方队,纷纷在全景影像、短视频、微视频、H5(第五代超文本标记语言)专题制作、虚拟现实(VR)技术、人工智能(AI)、大数据、数据图解等方面展示独家技能,并逐步颠覆以往的传播手段、传播方式、传播渠道,促进“两会”报道向“新媒体+媒体特色”报道方式华丽转变。新媒体直播神器粉墨登场,主流媒体展现各自的采编实力、传播能力,将移动直播技术发挥得淋漓尽致,为网民精心制作一顿全视角、零距离、面对面、实时移动直播的“两会大餐”,提供多维立体、全方位覆盖融媒体的“两会”盛况,凸显媒体深度融合、集团化报道新模式,开启“融媒体+报道”新航程。
一、人工智能(AI)+大数据报道初露锋芒
人工智能实际上是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能(AI)+大数据报道旨在实现以会话为基础、以智能机器人代替人的人机交互性,是未来新媒体报道发展的趋势之一。业界人士认为,内容分发就是通过实现用户对网站的就近访问及网络流量的智能分析,将本节点流媒体资源库中的指定内容,根据业务运营商定义的内容分发策略向下层节点推送。内容分发的关键是人工智能,核心是搜索引擎,信息流是搜索引擎的延伸。
以谷歌搜索为例。谷歌搜索引擎的机理和很多人工智能程序相同,都是以并行计算、大数据及更深层次算法为基础,完成对数据、问题的智能化分析。微软、脸书(Facebook)、百度等互联网企业率先投资研发聊天机器人,在现有的用户画像、场景匹配、人工智能等技术基础上,致力于研究适用于新媒体报道的个性分析、即时推送、机器人写作等技术应用,“机器人”新闻报道端倪可见。2016年全国“两会”,新华社客户端联合百度智能机器人“度秘”共同推出“度秘带你看‘两会’”特别报道,通过人机对话传递“两会”的好声音、权威解读政府工作报告。此后,在百度新闻上线的最新版本中,基于人工智能的“聊”新闻功能亮相,用户只要点击进入交互界面,就能获得自己所需的重要新闻,还可以向机器直接提问,查找所需内容。2017年3月1日,新华社客户端更新到4.0版本,推出独家“智能引擎”,综合运用大数据、人工智能、语音语义识别等技术,以人声和全媒体形态向用户反馈最新新闻资讯。
2017年全国“两会”,有媒体将智能机器人引入演播室,实现人机互动、实景虚拟切换,增加播报时尚感,吸引更多用户,由此带来点击率的提升。中国军视网推出全国“两会”机器人“军视侠001”,有关全国“两会”的日程安排、国防和军队改革等问题用户都可以向它询问,“军视侠001”会根据用户提问内容进行回答。2017年2月28日,《光明日报》宣布“小明AI两会”正式上线。这是一款国内首次将人工智能和大数据技术用于“两会”报道的应用,“两会”期间,“小明”每天会从最新的“两会”报道中分析信息、挖掘数据,及时为用户提供最新的“两会”报道盛况。
二、虚拟现实(VR)技术+H5、全景相机报道再创佳绩
虚拟现实技术+H5、全景相机在新闻报道中将编辑记者的个人化视角、全景视角与用户视觉和听觉相结合,受众的角色从大会外以虚拟身份进入会场,非常直观,如同身临其境。
或问:当我们的身体里有着大量的智能设备,就好像人工智能一样,那我们还是人吗?这个问题就像古希腊的“忒修斯之船”一般,其现实意义已经远远小于哲学意义。
在一家主营孵化器的创投基金支持下,南京成立了一个名为“奇思会”的组织,名字来源于“奇奇怪怪的思考的会”。这个会有不少创业者参加,大部分时候讨论一些所谓的务实话题,但偶尔也会讨论一些很虚无缥缈的事。比如在不久前,作为这个组织的理事之一,我就参与了一场题为“谁会逆袭,人还是人工智能”的PK式讨论。
这场讨论有些漫无边际,因为这事儿本身听着就有点漫无边际。很难想象,在当今还活着的人的生命中,会真正面临人工智能逆袭人的时代。虽然在《人与机器共同进化》这一书中,有人提出了相当激进的观点:30年内,技术奇点会来到。但这种说法,显然尚不足以成为共识。
《人与机器共同进化》是一本文集,由二十多篇文章组成,其中最重要的八篇文章共同组成了一个同名专题,专门探讨人与人工智能。这八篇文章立场不一,有的地方也有激烈的观点冲突,可以为试图了解这个虚无缥缈的话题的人提供一个全景式的扫描。这本书亦是“1024”系列中的一本,1024是东西网一个雄心勃勃的项目,试图译介大量海外前沿话题的讨论文章,当下,已经面世了好几册。
我的观点非常清晰明了:人工智能总有一天会发展到超出人类智能,而且,到了那一天后,人工智能压根不需要人类智能。这个观点其实和凯文·凯利有些类似,不过我这样考虑有我的出发点。至少在凯文·凯利的三本中译著中,没有发现他是这样考虑的。
一个很重要的问题是:机器再怎么发展,它未必有人性。人性是什么东西?人性的核心就是两样:贪婪,以及恐惧。小到个体行为,大到各种主义,统统扎根于这两个基本人性上。因为我们贪婪,所以我们要征服自然;同样也因为我们恐惧,所以我们要征服自然。
但机器会吗?机器会有贪婪吗?机器会有恐惧吗?如果机器没有贪婪与恐惧,它为什么要逆袭人类?如果机器会有贪婪与恐惧,它又会有何种贪婪与恐惧,以及,它为什么要拥有贪婪与恐惧?
人作为一种动物,“延续”是最根本的需求:个体延续与整个物种的延续。于是我们有了贪婪和恐惧,但有趣的是,机器有没有延续这种需求?机器的再生,想象中比任何一种动物都简单。更进一步的问题是:机器需要物种延续吗?机器本身是物种么?
比尔·乔伊在《为什么未来不需要我们》一文中已经描绘了一种景象:人类,已经成为这个世界无足轻重的一部分。当机器毁灭人类时,就好像人类毁灭某种动物时“纯属无意”:我们并不是要故意毁灭它们的,它们也根本不在我们贪婪与恐惧的范畴中。就如同一个人一不小心踩死一只蚂蚁一样,一个物种毁灭另外一个物种,却毫无目的。很悲哀的一件事就是,在机器的眼里,我们就像人类眼中的蚂蚁。也许被毁灭,也许不会。但总体来说,根本不重要,直接被无视。这件事让我们十分沮丧。
不过,这样的思考方式忽略了一点。拜大量的科幻小说和电影所赐,人工智能总是人类制造出来的另外一样事物,是人类将机器予以智能化。但现实有可能是这样发展的:人类自身加以机械化,从而变成一种以人类本身为基础的人工智能。
事实上,从桌上的电脑,到可携带的智能设备(手机、平板),到可穿戴的智能设备,再到可植入的智能设备,这条路径正在展开。我们正处于第三个阶段,即可穿戴设备大规模普及的前夜,也零星有一些可植入智能设备的问世。而在未来,一旦可植入设备大规模问世之后,我们,就是人工智能。我们,就是机器人。而这一天,也许就是二三十年的事。
如果把这种进路考虑进来,就意味着这样生成的人工智能具有人的最根本特性:贪婪、恐惧,也就意味着他们对未能升级的人类具有攻击毁灭的可能:因为到底还是一种动物,需要更多的资源。这种攻击毁灭并非是直接消灭,而是采用淘汰的方式。比如一个未能植入大脑芯片的学生,在高考之类的考试中,毫无疑问会被淘汰,在社会中也毫无竞争力。这会驱使更多的人寻求各种可能,成为“人工智能”。而真正意义上所谓的纯种人,将不复存在。
这样的未来,是好是坏?是足以乐观还是需要悲观?我倒是以为,这样的问题毫无必要。每个时代都有每个时代的道德感和准则,用今天的道德感去衡量古人会很可笑,去衡量未来,同样可笑。杞人又何需忧天?
或问:当我们的身体里有着大量的智能设备,就好像人工智能一样,那我们还是人吗?这个问题就像古希腊的“忒修斯之船”一般,其现实意义,已经远远小于哲学意义。
链接
1、《人工智能——一种现代方法》
作 者:[美]拉塞尔,[美]诺文 著,姜哲 等译
出 版 社:人民邮电出版社
出版时间:2010-8-1
本书以详尽和丰富的资料,从理性智能体的角度,全面阐述了人工智能领域的核心内容,并深入介绍了各个主要的研究方向,既详细介绍了大量的基本概念、思想和算法,也描述了各研究方向最前沿的进展,同时收集整理了详实的历史文献与事件。
2、《互联网进化论》
作 者:刘锋 著
出 版 社:清华大学出版社
出版时间:2012-9-1
通过互联网进化论的提出,作者将云计算、物联网、移动互联网与传统互联网有机地结合在一起。本书全方位地介绍了互联网的技术要点和商业模式,深入探讨了互联网的未来发展趋势。
3、《信息简史》
作 者:[美]詹姆斯·格雷克 著,高博 译
出 版 社:人民邮电出版社
工作中存在的不足网络舆情监测工作是指网络信息工作的部门或人员在特定时期或者在特定的事件中对公众在互联网上发表的言论和意见进行监视、收集、分析、整理及预测的行为,这些言论被称为网络舆情。
当前的网络舆情监测工作平台主要是基于信息采集、整合技术和智能处理技术,通过对互联网海量信息的自动抓取、自动分类聚类、主题检测、专题聚焦,实现对用户的网络舆情监测,并由相关部门形成舆情工作报告、舆情信息简报等,为舆论引导提供可靠的分析依据。
进入大数据时代,网络舆论呈现的新特点,促使网络舆情监测工作暴露出诸多不足之处,这为网络舆情监测工作带来了诸多挑战。
网络舆论信息格局发生变化,舆情分析质量亟待提高。据人民网权威的《2016年中国互联网舆情分析报告》显示,在2016年,伴随着移动互联网应用不断向社会各层面渗透,网络舆论的格局发生了很大变化,如网民结构与社会人口结构趋同,网民产生代际更新导致网络流行议题和文化热点发生转换,微博、微信平台化,专业自媒体步入兴盛等。在这样的变局下,网络舆情监测工作面临着新的挑战。然而,有些部门的舆情信息收集工作仍然停留在报刊、门户网站、BBS、微博等开源信息的收集阶段,并未将新闻客户端、微信、直播等平台打通,难以保证舆情信息分析的全面性以及舆情热度指标的准确性。《2016年中国互联网舆情分析报告》还对近五年来参与当年最具网络关注度的20个舆情热点事件讨论的320万微博用户样本进行了分析,发现关注新闻事件和聚焦热点话题的网民发生了代际交替,在性别方面,女性的比例明显上升;在地域上,三、四线城市用户增长迅猛。受众层面发生的这些变化,也将在舆情监测工作中体现出来。然而在目前的舆情监测工作中,相关信息部门的舆情信息报送在内容上只是就事论事、停留在现象层面,对受众的成分、热点事件的社会背景以及事件背后所反映出来的社会问题没有进行细致深入的研究分析;在形式上,网络舆情监测工作的报送还停留在工作动态报告或者事件日志等形式的报送上。这样就造成了网络舆情信息的价值作用降低、服务能力减弱的问题。
热点事件话语体系不可控,舆情预警能力亟待增强。纵观近年来发生的热点公共突发事件,可以发现,在以大数据为基础的社交平台上,公众的话语体系呈现出了一些全新特征,如舆论主体的匿名性、参与渠道的多元化、生成议题的自发性、交流观点的无界性、汇集意见的实时性、发展趋势的不确定性等。这些特征与舆论话语体系在传统媒体的呈现完全不同,网络舆论热点事件话语体系的不可控性大大增强。
在社交媒体平台上,自媒体呈现出来的话语体系最为庞杂。许多舆情信息不仅包含结构化数据,还涉及大量非结构化数据,若对其准确性、真实性逐一核查,既耗费人力又耗费时间。就内容而言,较多负面、虚假舆情具有较强的隐蔽性,单纯以关键词或主题词进行搜索容易产生误判、遗漏。话语体系的不可控性增加了舆情监测工作的难度,这要求工作人员必须具备过硬的专业敏感性以及较强的网络操作技能。但是目前大多数舆情监测工作部门的信息工作人员缺乏专业化的训练,舆情信息工作水平参差不齐。就舆情监测平台系统来说,对于舆情信息的跟踪分析灵敏度较低,在有些热点事件的处理上没有按照公共突发事件的分类标准进行准确的分级,从而导致网络舆情信息的分析判断力体现不出其应有的情报价值,预警能力也随之削弱。
舆情监测的技术体系落后,人机不协调问题亟待解决。网络舆论的实时性及其发展的不确定性要求网络舆情监测必须迅速、及时,但很多单位部门的舆情监测平台的方法技术体系滞后,部分单位采用了网络监控系统、有害信息过滤系统等方式进行网络舆情监测,而有些单位为了节省舆情监测设备的成本,甚至将网络舆情监测工作依托于人工网页搜索及浏览的“人工盯梢”方式上,这成为监测工作的一大阻碍,监测工作出现疏忽错判也在所难免。排除资金、人力等客观因素,现阶段的网络舆情监测工作中技术方法体系的不足主要归因于“人机不协调”。机器与人工的协同分工模式不成熟、机器的辅助力量不够,导致人工智能技术在预测监测体系中分析情感、预测走势、检查效果等方面应用还稍显粗浅、机械,而在需要人工进行的高级维度分析、提出应对策略等层面,机器的应用又显得粗糙以及同质化。
人工智能为网络舆情监测带来的三大变革
网络舆情监测要适应大数据时代人工智能的要求,就必须顺势而为,积极进行变革,主要包括网络舆情监测技术体系的变革、网络舆情监测研究范式的变革以及网络舆情监测管理思维的变革三个方面。
网络舆情监测技术体系的变革。将人工智能技术应用于网络舆情是为了更好地对舆情进行分析研判,通过直观、简明的方式描述网络舆情信息的产生,进一步推导信息传播主体的态度倾向性、情绪感染性以及初衷、意图等,从而预测网络舆情信息的发展趋势。
如果说在“小数据”环境下,网络舆情监测工作还可以依托于“人工盯梢”的方式来完成,那么在“大数据”环境下,当数据的量级达到了EB甚至ZB级别后,以人工监测来把握舆情脉络已成为不可能完成的任务。而那些隐含在网络舆情信息中的观点、态度及情绪的表达,更难以从泛滥成灾的信息碎片中被真正发掘出来。加之海量信息的不共享所带来的“信息盲区”,更使得舆情信息分析不够严谨,易偏离实际,而这些问题都需要依托搭建智能化的网络舆情监管平台来解决。在平台上可以通过三种人工智能技术实现数据分析与人工智能研判相结合,再借助如眼动仪、脑电仪等受众检验仪器对网络舆情信息进行综合化分析。三种主要的人工智能技术主要包括:一是Web挖掘技术,该技术把互联网与数据挖掘技术结合起来,对网络上结构化数据如文字言论,以及非结构化的数据如视音频、图像等信息进行采集,完成信息前期处理的第一步;二是语义识别技术,该技术是利用采集到的信息,通过对语句中的关键词进行词义推断处理以及句子语法结构的分析,从而将复杂信息简单化,这是对采集的信息数据做进一步识别推断的过程;三是TFDF信息聚类技术,该技术主要提升数据信息的分析和分类速度,使网络舆情监测工作的处理更加及时,反应更加灵敏,提高采取措施的时效性。
人工智能技术的介入将有利于对信息进行挖掘、采集、分类、整理,从而找寻出最核心的关键性数据。在此基础上,还可以运用人工神经网络预测模型,对网络舆情的性质、发展趋势进行正确描述,并提出相应的对策。
网络舆情监测研究范式的变革。人工智能和大数据对网络舆情监测工作及其研究产生了颇为深刻的影响,舆情监测的研究范式从多角度发生了转向。
第一,舆情监测工作视角的转向:从单一化到多元化。在社交媒体平台上,受众的角色首先发生了转向,由信息的被动接收者转变为信息的参与者和传播者。这一转向给网络舆情监测工作带来了新的挑战,当受众是单纯的信息接收方时,网络信息的可控性强,舆情监测工作形式单一,把关相对容易。而受众角色发生变化以后,网络信息传播的不可控性大大增加,信息传播速度加快,信息传播呈现多元化特征,把关难度增加,网络舆情监测工作也从单一转向多元化,还需要对信息进行疏导、研判处理。
第二,研究视角的转向:从内容研究转向“内容+关系”研究。传统的网络舆情信息研究最重视的是受众借助网络进行的话语表达,其研究视角主要集中在内容层面。随着人工智能技术的介入,这一单向视角将发生转变,潜藏在内容层面背后的网络受众心理、行为、动机、诉求等多方面因素都将被关注到。借助人工智能技术及大数据分析技术,网络舆情信息的研究视角将透过内容层面深入到关系层面,转向对网络受众社会心理描绘、社会关系呈现、社会话语表达等多维度的研究。
第三,研究重点的转向:由舆情监测转向舆情预测。当前的网络舆情监测工作主要通过对当下网络舆情的动态信息进行随机采样来收集、整理、分析,更多的是关注已经发生的事件在过去及当下的动向,对未来的发展预测难以兼顾。而借助人工神经网络预测模型,通过自然语言处理、模式识别及机器学习等人工智能技术,可以对网络舆情的性质、发展趋势进行正确描述,再结合大数据分析处理整群数据来实现预测功能。比如,著名的搜索引擎公司谷歌通过关注用户搜索中的“流感”关键词来预测实际流感发生的时间,往往可以提前两三个周对流感的爆发进行预报及预防。
网络舆情监测管理思维的变革。在以人工智能技术为支撑的网络舆情监测平台出现之前,相关舆情监测部门的管理者往往由一人或几人的小团队组成,在监测信息数据量级不大的情况下,这种小作坊式单打独斗、面面俱到的舆情监控管理思维可以基本满足需求。但是随着人工智能技术的发展及大数据时代的到来,这种小作坊式的舆情监测体系面临瓦解。当前,商业化运营的软件监测团队多达几百家,这些监测软件服务商通过开发相应的舆情监测软件为政府部门、企业主体以及科研院所提供服务,进行简单的舆情信息数据采集及分类处理工作。在数据开源的情况下,这些软件服务商的竞争逐渐由粗放型、低层次化向数据处理的优化、人机互动、机器算法的精进等层面转变。
在以上变化的基础上,舆情监测的管理思维也必须转向,组建一支人员分工明确、高度聚合集约的舆情分析团队势在必行。舆情管理的思维变革依托于人工智能监控系统改变团队的组织结构及管理方式,通过智能化的舆情监测系统代替低效的人工操作,其专业性要求颇高,而最佳处理模式就是专业化团队加人工智能技术。按照这样的管理思维,未来舆情监测团队的分工将更加明确,行业内部集约聚合程度将进一步提高,行业有机化程度也将逐步增强。
(转自.cn/bbs)
工学 ENGINEERING
课程中文名称 课程英文名称
高等数理方法 Advanced Mathematical Method
弹塑性力学 Elastic-Plastic Mechanics
板壳理论 Theory of Plate and Shell
高等工程力学 Advanced Engineering Mechanics
板壳非线性力学 Nonlinear Mechanics of Plate and Shell
复合材料结构力学 Structural Mechanics of Composite Material
弹性元件的理论及设计 Theory and Design of Elastic Element
非线性振动 Nonlinear Vibration
高等土力学 Advanced Soil Mechanics
分析力学 Analytic Mechanics
随机振动 Random Vibration
数值分析 Numerical Analysis
基础工程计算与分析 Calculation and Analysis of Founda tion
Engineering
结构动力学 Structural Dynamics
实验力学 Laboratory Mechanics
损伤与断裂 Damage and Fracture
小波分析 Wavelet Analysis
有限元与边界元分析方法 Analytical Method of Finite Element and
Boundary Element
最优化设计方法 Optimal Design Method
弹性力学 Elastic Mechanics
高层建筑基础 Tall Building Foundation
动力学 Dynanics
土的本构关系 Soil Constitutive Relation
数学建模 Mathematical Modeling
现代通信理论与技术 Emerging Communications Theory and Technology
数字信号处理 Digital Signal Processing
网络理论与多媒体技术 Multi-media and Network Technology
医用电子学 Electronics for Medicine
计算微电子学 Computational Microelectronics
集成电路材料和系统电子学 Material and System Electronics for In
tegrated Circuits
网络集成与大型数据库 Computer Network Integrating Technology and Large
scale Database
现代数字系统 Modern Digital System
微机应用系统设计 Microcomputer Application Design
计算机网络新技术 Modern Computer Network Technologies
网络信息系统 Network Information System
图像传输与处理 Image Transmission and Processing
图像编码理论 Theory of Image Coding
遥感技术 Remote Sensing Techniques
虚拟仪器系统设计 Design of Virtual Instrument System
生物医学信号处理技术 Signal Processing for Biology and Medicine
光纤光学 Fiber Optics
VLSI的EDA技术 EDA Techniques for VLSI
电子系统的ASIC技术 ASIC Design Technologies
VLSI技术与检测方法 VLSI Techniques & Its Examination
专题阅读或专题研究 The Special Subject Study
信息论 Information Theory
半导体物理学 Semiconductor Physics
通信原理 Principle of Communication
现代数理逻辑 Modern Mathematical Logic
算法分析与设计 Analysis and Design of Algorithms
高级计算机网络 Advanced Computer Networks
高级软件工程 Advanced Software Engineering
数字图像处理 Digital Image Processing
知识工程原理 Principles of Knowledge Engineering
面向对象程序设计 Object-Oriented Programming
形式语言与自动机 Formal Languages and Automata
人工智能程序设计 Artificial Intelligence Programming
软件质量与测试 Software Quality and Testing
大型数据库原理与高级开发技术 Principles of Large-Scale Data-Bas e and
Advanced Development Technology
自然智能与人工智能 Natural Intelligence and Artificial Intelligence
Unix操作系统分析 Analysis of Unix System
计算机图形学 Computer Graphics
Internet与Intranet技术 Internet and Intranet Technology
多媒体技术 Multimedia Technology
数据仓库技术与联机分析处理 Data Warehouse and OLAP
程序设计方法学 Methodology of Programming
计算机信息保密与安全 Secrecy and Security of Computer Information
电子商务 Electronic Commerce
分布式系统与分布式处理 Distributed Systems and Distributed Processing
并行处理与并行程序设计 Parallel Processing and Parallel Programming
模糊信息处理技术 Fuzzy Information Processing Technology
人工神经网络及应用 Artificial Intelligence and Its Applications
Unix编程环境 Unix Programming Environment
计算机视觉 Computer Vision
高级管理信息系统 Advanced Management Information Systems
信息系统综合集成理论及方法 Theory and Methodology of Information n
System
Integration
计算机科学研究新进展 Advances in Computer Science
离散数学 Discrete Mathematics
操作系统 Operating System
数据库原理 Principles of Database
编译原理 Principles of Compiler
程序设计语言 Programming Language
数据结构 Data Structure
计算机科学中的逻辑学 Logic in Computer Science
面向对象系统分析与设计 Object-Oriented System Analysis and Design
高等数值分析 Advanced Numeric Analysis
人工智能技术 Artificial Intelligence Technology
软计算理论及应用 Theory and Application of Soft-Computing
逻辑程序设计与专家系统 Logic Programming and Expert Systems
模式识别 Pattern Recognition
软件测试技术 Software Testing Technology
高级计算机网络与集成技术 Advanced Computer Networks and Integration
Technology
语音信号处理 Speech Signal Processing
系统分析与软件工具 System Analysis and Software Tools
计算机仿真 Computer Simulation
计算机控制 Computer Control
图像通信技术 Image Communication Technology
人工神经网络及应用 Artificial Intelligence and Its Applications
计算机技术研究新进展 Advances in Computer Technology
环境生物学 Environmental Biology
水环境生态学模型 Models of Water Quality
环境化学 Environmental Chemistry
环境生物技术 Environmental Biotechnology
水域生态学 Aquatic Ecology
环境工程 Environmental Engineering
环境科学研究方法 Study Methodology of Environmental Science
藻类生理生态学 Ecological Physiology in Algae
水生动物生理生态学 Physiological Ecology of Aquatic Animal
专业文献综述 Review on Special Information
废水处理与回用 Sewage Disposal and Re-use
生物医学材料学及实验 Biomaterials and Experiments
现代测试分析 Modern Testing Technology and Methods
生物材料结构与性能 Structures and Properties of Biomaterials
计算机基础 Computer Basis
医学信息学 Medical Informatics
计算机汇编语言 Computer Assembly Language
学科前沿讲座 Lectures on Frontiers of the Discipline
组织工程学 Tissue Engineering
生物医学工程概论 Introduction to Biomedical Engineering
高等生物化学 Advanced Biochemistry
光学与统计物理 Optics and Statistical Physics
图像分析 Image Treatment
数据处理分析与建模 Data Analysis and Constituting Model
高级数据库 Advanced Database
计算机网络 Computer Network
多媒体技术 Technology of Multimedia
软件工程 Software Engineering
药物化学 Pharmaceutical Chemistry
功能高分子 Functional Polymer
人工智能(AL)+大数据报道初露锋芒、端倪可见
人工智能(AL)+大数据报道,旨在实现以会话为基础、以智能机器人代替人的人机交互性,是未来新媒体报道发展的使然。
2016年全国两会,新华社客户端联合百度智能机器人“度秘”共同推出“度秘带你看两会”特别报道,通过人机对话,传递两会的好声音、权威解读政府工作报告。此后,在百度新闻上线的最新版本中,基于人工智能的“聊”新闻功能亮相,用户只要点击进入交互界面,就能获得自己所需的重要新闻,还可以向机器直接提问,查找所需内容。3月1日,新华社客户端更新到4.0版本,推出独家“智能引擎”,综合运用大数据、人工智能、语音语义识别等技术,以人声和全媒体形态向用户反馈最新新闻资讯。
2017年全国两会,有的主流媒体将智能机器人引入演播室,实现人机互动、实景虚拟切换,增加播报时尚感,吸引更多用户,由此带来点击率的提升。中国军视网推出全国两会机器人“军视侠001”,有关全国两会的日程安排、国防和军队改革等问题用户都可以向它询问,“军视侠001”会把它所知道的一切都告诉你。2月28日,光明日报宣布“小明AI两会”正式上线。这是一款国内首次将人工智能和大数据技术用于两会报道的应用,开创了两会报道文字、图片和语音三种交互方式、热点新闻的新模式。全国两会期间,“小明”每天会从最新的两会报道中分析信息、挖掘数据,及时为用户提供最新的两会报道盛况。
虚拟现实技术(VR)+H5、全景相机报道再接再厉、再创佳绩
在新闻报道中运用虚拟现实技术+H5、全景相机,编辑记者的个人化视角、全景视角与用户视觉听觉相结合,受众的角色从会外虚拟进入会场,而且非常直观,如同身临其境。2016年全国两会,主流媒体进行了虚拟现实(VR)+H5、全景相机在新闻报道中成功尝试,推出了全景报道、虚拟会场。
2017年全国两会,主流媒体将再接再厉、再创佳绩,多家媒体推出VR频道,采取VR、H5、360度相机等新媒体创新技术,让今年全国两会更加清晰透明、立体直观、全方位移动直播,用户可从不同的视角“参与”两会,让其有直达现场之感。用户只要打开移动客户端,佩戴VR眼镜,新媒体设备不仅记录会议立体多维空间动态全景,而且让网民感觉自己仿佛就是现场听众,身临其境地观察两会现场的精彩效果。
新华社记者使用的360度全景录播、拍照设备,酷似外星人的造型引人注意。光明日报向媒体界亮相一套被称之为“钢铁侠多信道直播云台”,首次将裸眼与VR直播应用到全国两会新闻报道中。“钢铁侠多信道直播云台”的最大特点是仅需一名记者就可实现普通视频、全景、VR的同步录制与直播。报客户端全新改版,以全新界面亮相,实现栏目定制功能,并推出H5、VR、直播等特色频道,努力打造内容更加丰富、功能更加强大、用户体验效果更加时尚的权威军事新媒体平台。中国军视网推出《指尖“微两会”》系列H5,普及两会知识、报道两会动态。《法制晚报》记者头戴的安全帽上装有全景VR直播镜头,备受媒体人关注。有的主流媒体提出“带你身临其境看两会”的报道口号,前方记者开启“VR模式”,画面、声音无死角记录;后方用户打开客户端,足不出户就能看到两会场景,实现360度沉浸式体验。
与VR技术营造的“虚拟空间”不同,AR技术通过引入多层次的数字信息,对真实事物进行丰富与完善,从而实现虚拟与现实之间实时无缝接合。
移动直播(MB)+新闻移动网(客户端)报道终端随人走、直播随时看
目前,新媒体进入移动互联网时代,5G时代即将来临,会议报道移动直播渐成常态。2016年被称为中国网络直播元年,拉开了用户通过网络直播看两会的序幕。2017年全国两会,新媒体网络直播将进一步延伸,拓宽传播渠道。主流媒体除了在电视、网站和新闻客户端的直播外,门户网站也将直播延伸到了客户端平台。
有的主流媒体竞相在移动传播、移动视频直播发力,坚持移动优先、传播快速原则,第一时间向移动端供稿,彼此展开谁新闻首发、谁速度第一的较量。开通两会全场直播和新闻会、政府工作报告解读、部长通道(之声)、两会专访全程视频直播,掀起媒体直播大变革,彻底改变以往用户的信息获取方式,更适合用户阅读体验、心灵洗涤、美的享受。用户只要扫描主流媒体客户端二维码,即可进入移动直播画面屏幕。据两会现场工作人员透露,今年两会期间 “部长通道”采访,部长们会与记者们面对面交流。所有部长交流画面和讲话,用户都可实时收看、回放。2月19日,人民日报社全国移动直播平台“人民直播”、新华社推出移动直播功能的“现场云”、央视新闻移动网也相继亮相,进一步实现了多屏联动、互动分享、社交化的功能。
2017全国两会,人民网开设人民访谈直播,联合腾讯网重磅推出超100小时的大型视频直播节目《两会进行时》。从3月3日9时起,每天9小时在PC端、移动端不间断视频直播、全景直播两会,将《两会进行时》贯穿两会始终,内容涵盖两会核心议程,以及前方记者的一线报道、高端访谈、权威解读、会场花絮及创意微视频等各个方面,为用户提供全视角、多层次、移动化的两会直播体验。新华社进一步突出创新和融合理念,在新华网首页首屏上开设2017年全国两会报道融媒体专区,推出两会直播、特别栏目部长之声、的两会时间咋安排?、1分钟视频告诉你!、两会特别节目共商国是、两会访谈、两会视频,多终端、全方位覆盖两会焦点。2月19日,中央电视台倾力打造的移动融媒体新闻平台――央视新闻移动网正式上线。该网既是一款以移动直播为常态产品的新闻资讯客户端,也是一个基于电脑端的新闻网站,通过互动直播、即时视频回传、多屏联动等功能,使用户直击正在发生的新闻现场,看到更多、更快的新闻资讯。2月22日,央视新闻联播主持人W阳夏丹在节目结尾处一改以往表述获取更多新闻资讯的常态,请关注央视新闻的微博、微信和客户端的方式,改为请您关注我们的央视新闻移动网,下载地址可以搜索“央视新闻+”。央视网在今年全国两会专题页面右上角显示PC客户端、移动客户端。自3月3日9时起,央视新闻遍布全球的记者可以通过央视新闻移动网APP来完成现场的采集、编码、传输等环节,开通两会新视角:“移动直播”(跟着主播上两会),“快看两会来啦,这六大看点你得get到”,“快看部长通道第一问教育部长就夸问题好!关于啥?”。光明日报推出的“钢铁侠多信道直播云台”,利用光明云的服务同时实现包括电脑、微信和手机APP等跨平台的新闻直播与,将同时为15家平台提供高达3K画幅、4M码流(每秒传输在0.5MB)高清视频和VR视频信号。新浪新闻在今年两会期间,与人民日报、央视网、央视财经、中国网、中国新闻网等10家中央媒体,以及北京青年报、广东卫视等10家地方媒体达成直播合作,搭建起融媒体平台,打造两会期间最大的媒体报道直播联盟。
5G时代的到来,令人憧憬,标志着移动互联时代“终端随人走、直播随时看。可以预见,随着5G、人工智能、可穿戴设备等技术的不断演进,移动媒体、新闻客户端必将进入加速发展的新阶段,推动互动交流普及化、官民化、常态化。互动交流,是“互联网+”催生出来的民主新业态,“三微一端”(微信、微博、微视频、客户端)是代表委员之间交流、代表委员与网民之间沟通的主渠道。互动最大的特点是能给网民带来两会心声或者表达个人的意愿,而“三微一端”为代表委员与网民搭建起建言献策的面对面、零距离沟通平台。
关键词:机器学习
数据挖掘
人工智能
中图分类号:TP181
文献标识码:A
文章编号:1002-2422(2010)03-0093-02
1机器学习概述及方法分类
1,1机器学习的概念、应用及发展概况
机器学习是一种使获取知识自动化的计算方法的学习。机器学习在人工智能的研究中具有十分重要的地位。其应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。
对机器学习的研究大致经过以下四个阶段:
(1)20世纪50年代的神经模拟和决策理论技术,学习系统在运行时还很少具有结构或知识。主要方法是建造神经网络和自组织学习系统,学习表现为阈值逻辑单元传送信号的反馈调整。
(2)20世纪60年代早期开始研究面向概念的学习,即符号学习。使用的工具是语义网络或谓词逻辑,不再是数值或者统计方法。在概念获取中,学习系统通过分析相关概念的大量正例和反例来构造概念的符号表示。
(3)20世纪70年代中期,研究活动日趋兴旺。1980年在卡内基・梅隆大学召开的第一届机器学习专题研讨会,标志着机器学习正式成为人工智能的一个独立研究领域。
(4)20世纪80年代中后期至今,机器学习研究进入一个新阶段,已趋向成熟。神经网络的复苏,带动着各种非符号学习方法与符号学习并驾齐驱,并且已超越人工智能研究范围,进入到自动化及模式识别等领域,各种学习方法开始继承,多策略学习已经使学习系统愈具应用价值,而运用机器学习的数据挖掘在商业领域中的应用则是最好的例子。
1,2机器学习方法的分类
Bose和Mahapatra归纳了数据挖掘中使用的机器学习技术主要有以下五种:
(1)规则归纳:规则归纳从训练集中产生一棵决策树或一组决策规则来进行分类。决策树可以转化成一组规则,分类规则通常用析取范式表示。规则归纳主要优点是处理大数据集的能力强,适合分类和预测型的任务,结果易于解释,技术上易于实施。
(2)神经网络:由类似人脑神经元的处理单元组成,输入节点通过隐藏节点与输出节点相连接从而组成一个多层网络结构。节点的输入信号等于所有通过其输入链接到达此节点的信号的加权和。神经网络由相互连接的输入层、中间层、输出层组成。中间层由多个节点组成,完成大部分网络工作。输出层输出数据分析的执行结果。
神经网络的最大优点是能精确地对复杂问题进行预测。其缺点是处理大数据集时效率较低,用户在使用这种方法的时候需要具备相当的建立和运行该系统的工具知识。
(3)事例推理:每个事例都由问题描述和问题的解决方法两部分构成。提出问题后,系统会寻找匹配事例和解决方法。其优点是能够较好地处理污染数据和缺失数据,非常适用于有大量事例的领域。
(4)遗传算法:是一种基于生物进化过程的组合优化方法。其基本思想是适者生存,基本操作包括繁殖、杂交和变异三个过程。繁殖过程是从一个整体中选择基于某种特定标准的信息并对要求解的问题编码,产生初始群体,计算个体的适应度。杂交过程是把一个信息的某一部分与另一个信息的相关的部分进行交换。变异过程随机改变信息的某一部分以得到一个新的个体。重复这个操作,直到求得最佳或较佳的个体。遗传算法的优点是能够较好地处理污染数据和缺失数据,易于和其它系统集成。
(5)归纳性逻辑程序:用一级属性逻辑来定义、描述概念。首先定义正面和负面的例子,然后对新例子进行等级划分。这一方法具有较强的概念描述机制,能较好地表达复杂关系,体现专业领域知识,因而用该方法得出的模型易于理解。
2数据挖掘中机器学习技术的特性
商业数据库往往含有噪音,体现在存在错误和不一致性。如果数据验证过程不够充分,则可能允许用户输入不正确的数据,而数据迁移也可能产生破坏。
商业数据库的另一个常见问题是数据的缺失,尤其是当数据来自于不同的数据源时。由于数据编码标准和聚集策略的不同,有可能将导致无法对所有的属性进行分析。
另外,在商业数据挖掘中,数据集的大小从几吉到几兆不等,并往往还有大量的属性,所以可测量性是数据挖掘技术的一个重要方面。商业数据库含有多种属性类型,如果机器学习技术能够处理不同的数据类型,则将对数据挖掘产生更大的作用。
数据挖掘技术的预测精度是评价挖掘效果的一个非常重要的因素。遵循监督学习过程的机器学习系统首先被训练,但是系统对真实数据的预测精度往往低于对训练数据的预测精度。所以,能对真实数据得到较高的预测精度显然是一个所需的特性。
结果的可解释性是另一个重要的所需特性。在商业数据挖掘应用中往往需要使用不同的DSS或DBMS,所以与其他信息系统的易整合性也是一个需要的特性。不同的机器学习技术需要终端用户具有一定程度的工具知识和领域知识,一些技术还需要对数据进行大量的预处理工作,因此对于终端用户来说,易于理解和需要较少预处理工作的机器学习技术是比较好的。
3机器学习方法与数据挖掘任务类型
Bose和Mahapatra把运用于数据挖掘的机器学习方法在商业应用时的任务类型可以归结为如下;
(1)分类:利用一个训练集来确定最大可区分属性,当分类确定好之后,新的实例可以通过分析进行合适的分类。
(2)预测:根据已观测到的数据来找出可能的将来值和/或属性的分布。主要的任务之一是确定对要预测的属性影响最大的属性。
(3)关联:在寻找实体之间或者实体属性之间的潜在联系规律的关联分析当中,最常见的就是市场菜篮子分析。
(4)侦察:侦察的目的在于寻找异常的现象、离群数据、异常模式等等,并且给出支持决策的解释。
机器学习方法及其所对应解决的数据挖掘中的任务类型总结如表1所示。
关键词:数据挖掘,知识发现,挖掘算法,挖掘过程
一、数据挖掘的概念
1.1数据挖掘的定义
数据挖掘(Datamining 简称DM),可以说是数据库中的知识发现,它是指从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的,人们事先不知道的,但又是潜在的,有用的信息和知识的过程。它综合利用了统计学方法,模糊识别技术、人工智能方法,人工神经网络技术等相关技术,并对各行各业的生产数据,管理数据和经营数据进行处理、组织、分析、综合和解释,以期望从这些数据中挖掘并揭示出客观规律,反映内在联系和预测发展趋势的知识,例如医学研究人员希望从已有的成千上万份病历中找出患有某种疾病的病人的共同特征,从而为治愈这种疾病提供一些帮助。
从数据库中发现知识(KDD)一词首先出现在1989年举行的第一届国际联合人工智能学术会议上,到目前为止,美国人工智能协会主办的KDD国际研讨会已经召开了多次,规模由原来的专题讨论发展到国际学术大会,研究重点也逐渐从发现方法转向应用系统,注意多种发现策略和技术的集成,以及多种学科之间的相互渗透,数据挖掘与知识发现已成为当前国际上的一个研究热点。
1.2 数据挖掘的对象
数据挖掘常见的挖掘对象有:关系(Relational)数据库、事务(Transactional)数据库、面向对象(Objected-Oriented)数据库、主动(Active)数据库、空间(Spatial)数据库、时态(Temporal)数据库、文本(Textual)数据库、多媒体(Multi-Media)数据库、异质(Heterogeneous)数据库以及Web数据库等。
知识发现(KDD)被认为是从数据中发现有用知识的整个过程,数据挖掘只是数据库中知识发现的一个步骤,但又是最重要的一步,它用专门算法从数据中抽取模式,原始数据可以是结构化的,如关系型数据库中的数据,也可以是非结构化的,如文本、图形、图像数据,甚至是分布在网络上的异构型数据。
二、数据挖掘的意义
数据挖掘与传统的数据分析(如查询报表,联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息,发现知识,数据挖掘所得到的信息应具有先未知,有效和应用三个特征。
先前未知的信息是指该信息是预先未曾预料到的,即数据挖掘是要 发现那些不能靠直觉发现的信息知识,甚至是违背直觉的信息或知识,数据挖掘通过预测未来趋势及行为,做出前摄的,基于知识的决策。
三、数据挖掘的分类:
数据挖掘的任务就是从数据集中发现模式,模式有很多种,按功能分为两大类:(1)描述性挖掘,主要刻画数据库中数据的一般特性;(2)预测性挖掘,主要任务在当前数据上进行推断,以进行预测,在实际应用中,往往根据模式的实际作用及数据挖掘的任务分为以下几类:
(1)关联分析(associationanalysis):关联分析以发现关联规则(association rules)为目标,关联分析的典型例子是购物篮分析,描述顾客的购买行为(哪些商品常在一起购买)。例如“啤酒和尿布的故事”。
(2)分类(classification):首先分析一个训练样本数据集,找到一组能够描述数据集合典型特征的模型(或函数),然后使用这个模型分类识别未知数据的归属或类别,即将未知事例映射到某种离散类别之一,分类的方法很多,主要有决策树法、贝叶斯法、神经网络法,近邻学习或基于事例的学习等方法。例如,利用教师的相关数据(如职称、学历教龄等)以及学生对教师的教学评估结果构建分类模型(如决策数),可用于预测某一位新教师未来教学评估的结果,相关知识可用于指导学校人事部门的教师引进工作。
(3)聚类分析(clusteringanalysis):聚类分析所分析处理的数据对象事先无确定的类别属性,聚类分析的基本原则是:各积聚类(clusters)内部数据对象间的相似度最大化,各聚类对象间的相似度最小化,按照选定的度量数据对象之间相似度的计算公式,遵循聚类分析的基本原则,将数据对象划分成为多个类或簇,在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大,聚类分析主要应用于模式识别,数据分析,图像处理以及市场研究。
(4)序列分析(sequenceanalysis):序列分析是通过分析序列数据库寻找一定的规则和有趣的特征,广泛应用于对时间序列数据的分析,应用领域涉及经济学、生物医学、生态学、大气和海洋等。控制工程及信号处理,例如,web日志中的数据是典型的时间序列数据,它记录了用户与站点的交互信息及时间,对于商业网站而言,基于这些数据的挖掘对于其决策具有实用价值。
(5)孤立点分析:数据库中可能包含这样一些数据对象,它们与数据的一般行为或模型偏离很大,这些对象就是孤立点,大部分数据挖掘方法将孤立点视为噪声或异常而丢弃;而在一些应用中(如信用卡欺诈),罕见的事件可能比正常出现的更有趣,在市场分析中,可用于确定极低或极高收入的客户的消费行为。
四、数据挖掘的处理过程
数据挖掘来源于知识发现(KDD),是数据库发展和人工智能技术相结合的产物,因而数据挖掘包括KDD的全过程,类似于通常的一个开采过程,整个过程分为三个阶段来完成:数据准备阶段、数据挖掘阶段和结果显示阶段。
数据挖掘环境可示意如下图:
图1-1 数据挖掘环境框图
按工作流程包括以下几个步骤:
1、问题定义:对应用领域知识进行充分的理解和分析,明确挖掘对象和目标。
2、数据准备:
(1)搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据。
(2)数据净化和预处理包括去噪声,填补丢失的域,删除无效数据等。
(3)判断数据挖掘的功能类型,数据挖掘的功能类型分为验证型和发现型。验证型是指由用户首先提出假设;发现型是指用数据挖掘工具从数据中发现用户未知的事实、趋势、分类等。
(4)选择适宜的数据挖掘的算法。根据数据功能的类型和数据的特点选择相应的算法。常用的算法有人工神经元网络、决策树算法、集合论算法和遗传学算法等。
(5)进行数据转换。根据数据挖掘的目标、功能及数据挖掘算法,按指定方法组织数据,根据已了解的知识的出限定变量,转换数据类型并且映射数据到易于找到解的特征空间。
3、数据挖掘。在净化和转换过的数据集上进行数据挖掘。
4、结果的分析和同化。输出挖掘结果对数据挖掘出的结果进行解释和评价,转换成为能够最终被用户理解的知识。综合分析把已得到的知识和已有的知识进行综合,检查和处理它们之间的冲突,通过简明直观的方法把最终结果报告给用户,并且评价整个处理流程的性能。
五、结语
数据挖掘是目前国际上数据库和信息决策领域的前沿研究方向之一,也是当前计算机领域的一大热点,其研究的重点也逐渐从理论转移到了系统应用,随着技术的不断成熟,未来的应用领域也会更加广泛。只有更加深入的研究透了数据挖掘相关的理论,才能使其对未来社会的发展起到更积极的作用。
参考文献:
[1]朱明,数据挖掘[M],中国科学技术大学出版社,2002
[2]乔永生,数据挖掘的探讨[J],科技情报开发与经济,2006.16
[3](加)JiaweiHan, Micheline Kamber 著.范明 孟小峰等译.数据挖掘-概念与技术.北京:机械工业出版社.2001.15
[4]黎敏.数据挖掘算法研究与应用.大连:大连理工大学2004
【关键词】地形测量;数字化技术;发展
0.引言
地形测绘是研究地球局部表面形状和大小,并将其测绘成地形团的理论和技术。通过测定小范围地表高低起伏形态和地物(如建筑物、道路、耕地等)的特征点的平面位置和高程,经相应的数据处理、采用一定的测量符号按一定的比例缩绘在图纸上。从而获得与相应地面几何图形相似的地形图,为国家经济建设提供设计与施工的图纸资料。地形测量是为城市、矿区以及为各种工程提供不同比例尺的地形图,以满足城镇规划和各种经济建设的需要。 现代测绘技术因其具有自动化程度高、测图精度高、图形属性信息丰富和图形编辑方便等优点,在地形测量中已经得到了广泛的应用。本文就地形测量数字化技术的发展谈几点粗浅认识。
1.常用的地形测量技术
1.1 GPS技术
GPS即全球定位系统,20世纪70年代由美国开发,应用人造卫星所发射的讯号进行测时测距。GPS采用全球性地心坐标系统,以地球质量中心为坐标原点。具有对海、陆、空进行各个方面实时三维导航和定位本领,是一种高精度、全天候、高效率、多功能的测绘工具。
1.2 GIS技术
GIS即地理信息系统,兴起于20世纪60年代中期,在计算机软硬件支持下,将空间数据自动输入、存储、检索、运算、表现和综合研究应用。GIS是现代化办理的重要本领,更是遥感图像处理和应用的技术支撑。GIS中的数据包括:地理背景信息(外业测量数据、摄影测量数据、现有地图和各种遥感图像);资源与环境数据(各种专题(是指某样方面的内容集中收集,就形成专题,网络上通常指游戏专题或者新闻专题)图,科学研究研究成果,各种图形和图表,航天航空图像的解译成果);社会经济信息(人口普查、国民收入情况、工业分布及土地应用分类图表等)。
1.3 RS技术
RS即遥感技术,起源于20世纪60年代,不直接接触被分析的目标,感测目标的特征信息(一般是电磁波的反射、辐射和发射辐射),经过传输、处理,从中提取人们感兴趣的信息。遥感包括摄影、陆地、卫星、航空、航天摄影测量等技术。现代遥感技术是空间技术,是集光学、无线电、计算等相联合的一门新技术。近20年,遥感技术迅猛发展,它作为一种空间探测技术,至今已经历了地面遥感、航空遥感和航天遥感三个过程阶段。遥感技术依其波谱性质,可分为电磁波遥感技术、声学遥感技术、物理场遥感技术。遥感信息技术已从可知光发展到红外、微波,从单波段发展到多波段、多角度、多时相、多极化,从空间维扩展到时空维,从静态研究发展到动态监测。
1.4 3S的综合应用
RS为GIS提供信息源,GIS为RS提供空间数据办理和研究的技术本领(图像处理),GPS则作为GIS有力的补测、补绘本领,实现了GIS原始地图数据的实时更新。3S的综合应用充实发挥了各自的技术特征,快速准确经济地为人们提供所需的有关信息的新技术,三者紧密联合,为地形测量提供了精确的图形和数据。
1.5 RTK技术
地形测图一般是首先根据控制点加密图根控制点,然后在图根控制点上用经纬仪测图法或平板仪测图法测绘地形图。近几年发展到用全球仪和电子手簿采用地物编码的方法,利用测图软件测绘地形图。但都要求测站点与被测的周围地物地貌等碎部点之间通视,而且至少要求2-3人操作。采用RTK技术进行测图时,仅需一人背着仪器在要测的碎部点上呆上一、二秒钟并同时输入特征编码,通过电子手簿或便携微机记录,在点位精度合乎要求的情况下,把一个区域内的地形地物点位测定后回到室内或在野外,由专业测图软件可以输出所要求的地形图。用RTK技术测定点位不要求点间通视,仅需一人操作,便可完成测图工作,大大提高了测图的工作效率。
2.数字化地形测量的作业模式
地面数字测图系统,其模式主要有两种,即数字测记法模式和电子平板模式。
2.1数字测记法
数字测记法模式为野外测记,室内成图,即用全站仪测量,电子手簿记录,同时配以人工画草图和编码系统,到室内将野外测量数据从电子手簿直接传输到计算机中,再配以成图软件,根据编码系统以及参考草图编辑成图。使用的电子手簿可以是全站仪原配套的电子手簿,也可以是专门的记录手簿,或者直接利用全站仪具有的存储器和存储卡作为记录手簿。测记法成图的软件也有许多种。
2.2电子平板法
电子平板模式为野外测绘,实时显示,现场编辑成图。所谓电子平板测量,即将全站仪与装有成图软件的便携机联机,在测站上全站仪实测地形点,计算机屏幕现场显示点位和图形,并可对其进行编辑,满足测图要求后,将测量和编辑数据存盘。这样,相当于在现场就得到一张平板仪测绘的地形图,因此,无需画草图,并可在现场将测得图形和实地相对照,如果有错误和遗漏,也能得到及时纠正。
3.地形测量数字化技术的发展
3.1 3G技术及集成技术
积极普及3G技术的应用,改进3G技术中存在问题,更新3G及其集成技术测量的方法和手段,加强测量精度和准确性,使3G技术能在地形测量测绘技术领域的应用进一步扩展。全球数字摄影测量系统在GPS、GIS、RS和3S集成技术中的应用,对数码摄影测量和地形测量更加普及和深化,使测绘技术向电子化、自动化、数字化方向发展。
3.2测绘软件及数据库的更新
加强地形测量数字化测绘软件的研发,使测绘软件系统更加高效、灵活和功能齐全,使测绘软件技术在地形测量中起到了相当重要的作用。更新完善信息数据库,将采集的测量数据转换直接进入信息数据库,数据管理查询方便,数据共享,实现全球数据更新和扩展空间基础信息系统的动态管理,实现测量数据的管理科学化、标准化、信息化,实现测绘数据的传输网络化、多样化、社会化,使测绘技术走向自动化,实时化,数字化。
3.3人工智能和专家系统
随着计算机技术的发展和测绘技术与相关学科的交叉、综合,人工智能和专家系统在测绘技术中有着广泛的应用前景。计算机利用专家知识模拟人脑思维进行推理,从事智能化的数据、图形处理和信息管理工作,极大地提高工作效率,使测绘技术向自动化、智能化发展。 全球定位系统(GPS)、数字摄影测量系统(DPS)、遥感技术(RS)、地理信息系统(GIS)和专家系统(ES)这5S技术的发展和相互结合,专家系统在其中发挥着重要的作用,专家系统对整个测量流程进行控制,并执行相应的推理、分析和处理工作,并可实现信息资源共享,实时动态监测诊断,提高效率和质量,是测绘技术通向实时、自动、智能测量系统的关键。
4.结束语
综上所述,数字化地形测量是一种全解析的计算机辅助测量方法,具有明显的优越性和广阔的发展前景。它将成为地理信息系统的重要组成部分。这种模式正在替代而且必将完全替代传统的大平板仪地形测量,成为地形测量的主流模式,促进地形测绘工作有序、稳健发展。
【参考文献】
[1]谭志光.地形测量新方法的应用[J].建筑知识:学术刊,2011,11.
关键词:智能科学;情感计算;感性工学;机器人;教材
中途分类号:G642 文献标识码:B
1 引言
人工情感(Artificial Emotion)是利用信息科学的手段对人类情感过程进行模拟、识别和理解,使机器能够产生类人情感,并与人类进行自然和谐人机交互的研究领域。1981年就有人开始研究人工情感问题,但是直到1990年以后它才开始逐渐引起人们的关注,特别是近几年,对人工情感的研究越来越受到人们的重视。1995年,美国MIT媒体实验室的R,Picard教授提出了“情感计算(Affective Computing)”的概念,并于1997年正式出版了专著《Affective Computing》。情感计算研究就是试图创建一种能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计算机系统。日本学者Nagamachi提出了“感性工学(Kansei Engineering)”的新术语,并展开了以消费者为导向的新产品开发研究。2000年,北京科技大学的王志良教授提出了“人工心理(Artificial Psychology)”的理论,并于2007年出版了《人工心理》专著。
心理学家认为,人工情感是在人工智能理论框架下的一个质的进步,这充分表明了新世纪人工科学的多学科交叉研究,彼此互为影响的特点。人工情感必将为计算机的未来应用展现一种全新的方向。
2 学术科研背景
人工情感作为人工智能的扩展研究,已经在应用方面取得了许多进展(主要是在美国、日本和欧盟国家)。但是,由于情绪心理学理论方法的多样性,导致人工情感理论与研究方法都不十分成熟,使得应用技术受到了很大影响。
综合国际上关于人工情感专题研讨与论述,我们将人工情感研究领域面临的主要挑战归纳如下:
(1)情绪心理学理论的多样性,导致人工情感理论方法的不一致,以至于很难找到适用于信息科学的人工情感的统一理论方法。
(2)目前几乎还没有符合人类情感规律并适于机器实现的人工情感自动生成模型;
(3)在智能推理过程中,如何考虑情感影响的因素,实现真正意义上的拟人推理过程。
(4)目前还没有为人工情感研究者提供完善服务的计算机仿真平台及情感计算库。
(5)语音情感信息处理技术和表情识别技术的不成熟,成为制约人工情感与和谐人机交互技术发展的瓶颈。
(6)如何实现多模态情感信息融合、识别与理解,实现自然和谐的人机交互平台环境。
(7)人工情感的研究成果如何与成熟的人机交互平台相结合。
(8)如何验证机器情感的正确性是人工情感研究面临的图灵测试问题。
(9)如何从人工情绪(Artificial Emotion)走向仿真情绪(simulating Emotion)、工程情绪(Engineering Emotion),进而找到重大应用突破点,这将是一个亟待解决的问题。
针对这一学科前沿的源头问题,进行创新性研究,解决普遍认为是人工情感的几个困难问题,是我们未来研究面临的主要挑战,也是我们的机遇。
3 现实面临的问题
2003年,北京大学智能科学系率先提出成立“智能科学与技术”本科专业,主要从事机器感知、智能机器人、智能信息处理等交叉学科的研究和教学。并于2004年在国内开始招生。随后的几年里,全国多所重点院校都成立了自己的“智能科学与技术”专业,并拥有了相关的硕士点、博士点以及博士后流动站。
随着本科生、硕士生和博士生以及从事智能科学研究人员队伍的不断壮大,使得教材建设的问题逐渐凸显。“智能科学与技术”专业作为最年轻也最有发展潜力的学科,还没有自己专业系列教材,许多高校的教材大都采用计算机类、通讯类的课程,而这些教材大都处在“知识结构老化,更新缓慢”的状态,已经不能适应该学科的发展,成为制约学科建设和教学水平提高的重要因素。教材是基本教学内容的载体,好的教材可以在教学方法上提供相应的参考,不仅为教学提供依据,还会助推本学科不断完善,学生培养体系的逐渐规范。因此,建设新教材,使之尽快与国际接轨,已成为亟待解决的重大问题。
2007年开始,北京科技大学招收智能科学与技术专业本科生,该专业的本科生将在2009年下半年进入专业课阶段学习,专业教材的建设问题已迫在眉睫。我们通过跟踪调查北京科技大学智能科学与技术专业本科生、研究生的教育基础、教学现状和教学需求,结合兄弟院校的专业教学情况,深入分析我国现代化建设的人才需求和本学科的自身发展、结构特点,系统总结国内外在“智能科学与技术”专业教学改革和实践中取得的成果和共识,进行了《人工情感》教材的编写。
作为知识的载体,教材是按照一定的教育目标和教学规律组织起来的科学知识系统。从教材的构思到教材的最终出版,一般科学的方法总共需要经历如下几个步骤,如图1所示:
(1)教材构思、大纲制定:这一阶段主要是集思广益,根据教材所面对的受众群体,大概划定教材所要包含的内容,反复讨论并修改大纲,根据教材内容划分章节,制定章节标题。
(2)拓展思路、广搜资料:这一阶段主要是组织参编人员搜集第一手资料,整理素材,逐渐使材料规范化、书面化。
(3)分工明确、力求完善:这一阶段要组织好参编人员,做到各司其职,各负其责,把各人负责的章节按照事先的规划,将理论知识、应用实例、习题及答案补充完整。
(4)精益求精、查漏补缺:把已经初步完成的教材送给相关教师及同学,让他们以初学者的身份,以局外人的眼光反复阅读,提出意见。经过反复修改,书稿基本成型,添加上必要的前沿、提要和缩略语。
(5)课堂实践、反复审校:初步形成的教材讲义,必须要经过课堂教学的不断实践,并根据教学心得和课堂反馈意见反复修改。最后,拿给出版社审校,几经修改方可出版。
4 教材规划与内容安排
依据上述思路,自2003年起,结合我校研究生课程“人工心理和情感计算”的教学实践,在研究生讲义的基础上,我们着手“人工情感”研究生教材的资料收集、整理以及章节、内容安排,目前,该教材的终稿已交付并将在机械工业出版社出版。通过多年的教学实践,根据学生现状及教学效果,不断调整教材内容,以“适应性、实用性”为宗旨,定位于普通高校智能科学与技术专业研究生学生,以素质教育为需求,注重培养学生科研及创新能力, 提高学生的科学素养。
全书共分为9章:
第1章较详细地介绍了情绪心理学、情绪生理学、情绪社会学的基本理论及相关研究历程,总结了脑科学研究在情感计算中的作用及色彩与心理学之间的相互关系。
第2章介绍了情绪的空间描述及维度化理论,总结了几种比较典型的情绪维度空间理论及国外科研工作者提出的人类情感数学模型。
第3章阐述了用数学方法描述情绪的重要性,给出了几种典型的人工情感建模方法,展示了情感建模的发展状况及前沿研究。
第4章结合实际应用,介绍了几种情感建模方法,并给出了应用实例,有助于学习者理论联系实际,对人工情感的研究与发展树立起明确的目标。
第5章结合现代远程教育发展状况,提出了把远程学员的情感数字化方法,建立起情感模型,并应用到远程教育系统,取得了不错的效果。
第6章主要讲述了人脸识别系统的构成、实现方法,是一个应用性很强的人脸识别设计范例。
第7章详细介绍了表情识别系统的设计实现,详细讲解了特征点定位、提取方法以及基于SVM的表情分类器的设计。
第8章主要讲述了网络游戏中的情感数字化,阐述了人工情感在游戏设计中的应用。
第9章详细介绍了情感机器人的发展状况、设计及实现方法,并对人工情感在智能机器人的应用作了相应的阐述。
本教材在写法上尽量做到深入浅出、通俗易懂、简洁明了,编写过程中遵守了以下三点原则:
(1)全面性与计划性相结合
人工情感理论和应用研究,还是一个崭新领域,还有很多疑难问题没有解决,发展得不够成熟,所以在编写教材的过程中,我们尽量做到知识的全面性,从基础理论到热门方向的研究,都作了较为详细的介绍。同时,也考虑到系列教材的出版,在内容安排上,兼顾其他教材,做到统筹安排。
(2)基础知识与专业技术相结合
智能科学与技术专业的学生执行的是工科学生的培养计划,在心理学基础理论方面比较欠缺,因此本教材前四章以抛砖引玉的方式介绍了有关心理学、脑科学、计算数学的基础知识,并在后面几章中结合工科学生的专业技术,结合应用实例展开内容。
(3)理论知识与实践相结合
本教材在内容安排上注重理论与实际应用并重的原则,在理论阐述的基础上,对相关研究进行了应用举例,对初学者或者初涉此领域的研究者,都能起到很好的引导和启发作用,增强了学习者的学习动力,提高了他们的学习兴趣。
5 教学并举与科研相济
教材讲义已于2008年12月交付机械工业出版社,虽然目前还未出版,但教材的初稿已多次作为我校研究生“人工心理与情感计算”课程的讲稿,学生使用后普遍反映良好,认为教材充分体现了学科交叉的特点,融合了心理学、信息科学和智能科学的相关理论、算法思想和应用实例,并进行了相应的概括归纳,以简洁实用的方式呈现给读者,具有易读、易懂性,而且实例丰富,非常实用,并且就讲义中存在的问题,提出了宝贵的意见。
在完成了本版教材的编写工作的基础上,为达到教学并举,科研相济,经过多年的努力,我们已经建立了系列情感机器人系统实验平台(前文详细介绍),如图2情感机器人系统实验平台外形。这是一个多模态信息融合的实验平台,具有视频获取、声源定位、多路触摸传感、热释电感应及触摸屏选择等多通道输入,可以通过语音、动作、光电、图片等形式表达感情。该情感机器人采用开放式平台,能够为学生提供多种人工情感理论和模型的验证实验。图3为该情感机器人的系统体系结构。
6 展望未来
“智能科学与技术”专业在国内才刚刚起步,是一个全新的学科,各个学校都有自己的特色。目前来看,在学科建设方面制定一个普适的方案是不现实的。而特色课程恰恰是新学科区别与相关学科的重要标志,也是各个大学百花齐放的阵地。
5G网络主要具有三个显著特性:
高速率:在实际应用中,5G网络的速率是4G网络10倍以上;
低时延:5G网络的时延大约几十毫秒,比人的反应速度还要快;
广连接:5G网络出现,配合其他技术,将会打造一个全新的万物互联景象。
业内人士认为,相比4G网络,5G最大的突破就是可以海量连接。
4K是指具有4096×2160分辨率的超精细画面,清晰度能达到现有的1080p高清分辨率的4倍,可谓纤毫毕现,因此将能带来更加逼真的观看体验。
二、山西省是否有利用5G+4K技术推进文旅产业发展的相关政策?一些偏远的旅游景区,是否有关于景区5G覆盖的规划或策略?
截止目前,山西省文旅厅尚未制定有关5G+4K技术推进文旅产业发展的相关政策、以及一些偏远的旅游景区,有关于景区5G覆盖的规划或策略。
三、对景区美景、名胜古迹、民俗表演进行5G+4K的高清视频互联网直播。这种方式是否可行,对山西文旅发展是否有帮助?
首届山西网上艺术节期间通过文化云PC与移动端成功完成25次网络直播,在线直播观看人数突破26万人次。
2018年6月至10月接连上线的纪念改革开放40周年群众文化系列活动主题和首届非物质文化遗产博览会专题,共进行14场重大活动的在线直播,平均单场直播在线收看量近12000左右,一周回放量平均每场2.5万左右。
如果直播地区已经完成了5G网络覆盖,并有可以利用的直播平台,5G+4K直播方式是可行的。5G+4K直播方式,特别是全景直播,对于山西文化民俗的推广传播,以及对景区的宣传都有很大的帮助,目前中国联通正在准备为山西临汾的云丘山景区部署5G全景直播系统,用来对景点和云丘山的民俗活动进行现场全景直播,通过更多的这种全景直播的上线,借助远程沉浸式视频体验可以让全国更多的游客了解山西,并将有效提高山西旅游的游客数量。
四、智能导游的模式是否可行?
智能导游的方式有很多,需要根据不同的场景选择不同的智能导游方式。比如博物馆类可以选择以AR方式作为辅助讲解手段;山水风景等室外类,可以选择轻便型穿戴智能设备的方式进行在线智能讲解方式;对于人流不均衡的区域,可以采用AR智能导流结合导游讲解的方式。目前中国联通在临汾云丘山景区正在进行这方面的尝试,为景区提供基于AR的讲解体验创新业务。智能导游将有效提高景区的服务水平,但需要结合具体情况进行智能导游方式的选择。
【关键词】网络信息;检索
随着信息技术的高速发展,信息资源的越来越显得重要,而网络信息资源也逐步成为这个信息时代的核心资源。信息检索技术也很快得到发展,在此网络信息检索随着网络的发展也应运而生。网络信息检索,就是将描述特定用户所需网络信息的提问特征,与信息储存的检索标识进行异同比较,从中找出与提问一致或基本一致的网络信息的过程。相对传统文献检索,网络信息检索显现出了很多的优越性,如不受时间地点的限制,检索方式多样化,多元化等。但是我觉得网络信息检索的发展还不是十分完善,仍存在些问题,如目前检索工具在信息搜集缺乏统一的规范管理,检索过程会出现很多雷同,甚至无用的垃圾信息等。以下从网络信息检索目前存在的问题,及针对问题面临的以后的发展方向进行了探讨。
随着网上信息资源的膨胀发展,一种搜索引擎,无论它多么完善都不可能满足一个人所有的检索需求。如果遇到文献普查、专题查询、新闻调查与溯源、软件及MP3下载地址搜索等情况,人们就更需要使用多种搜索引擎来比较、筛选和相互印证。为解决逐一登陆各搜索引擎,在各搜索引擎中分别多次输入同一检索请求等烦琐操作,基于网络检索工具的检索工具产生了。
目前这列检索工具只要有两种:集成搜索引擎和元搜索引擎。所谓集成搜索引擎是在一个检索界面上链接若干种独立的搜索引擎,检索时,一次检索输入,可以指定搜索引擎也可以要求多个引擎同时检索,搜索结果由各搜索引擎分别以不同页面提交的网络检索工具,其实是利用网站链接技术形成的搜索引擎集合。集成搜索引擎制作与维护技术简单,可随时对所链接的搜索引擎进行增删调整和及时更新,尤其大规模专业搜索引擎集成链接,深受特定用户群欢迎。如国内天网搜霸和百度搜霸,国外比较著名的有“搜索之家” “网际瑞士军刀”等。
另一个是元搜索引擎,用户只需递交一次检索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一的格式呈现到用户面前。国外比较著名的元搜索引擎有Vivisimo、EZ2WWW、Kartoo、SurfWax、Fazzle等。目前国内现在还没有见到真正意义上的元搜索引擎。元搜索引擎虽没有网页搜寻机制,亦无独立的索引数据库,但在检索请求提交、检索接口和检索结果显示等方面,均有自己研发的特色元搜索技术支持。目前元搜索引擎技术主要有并行处理式和串行处理式两大类。并行式元搜索引擎运行时是将查询请求同时发向各个独立搜索引擎,然后将的结果按特定的顺序呈现给用户;串行式元搜索引擎运行时是将查询请求先发向某个独立搜索引擎,待其返回结果后再将请求发往另一个独立搜索引擎。
从第一个元搜索引擎Metacrawler诞生至今,这一新型的网络检索工具异军突起,发展迅速,目前可用的元搜索引擎已近百种。由于元搜索引擎的功能受着源搜索引擎和元搜索技术的双重制约,元搜索引擎比较理想的并不多见。信息检索专家邢志宇将元搜索引擎存在的问题归纳如下:(1)大多元搜索引擎不支持多语种,尤其是汉语检索;(2)一些元搜索引擎实现检索语法转换的能力有限,不支持指定字段检索,不能充分发挥各个独立搜索引擎的高级检索功能;(3)部分元搜索引擎无源搜索引擎列表,用户不能自主选择和调用源搜索引擎;(4)大部分元搜索引擎仅支持调用AltaVista、Excite、、Yahoo!、Infoseek、Lycos等常用的搜索引擎,一些大型搜索引擎如NorthernLight、HotBot等被排除在外,人为地限制了搜索资源的利用;(5)在检索结果上,元搜索引擎只能返回十几、数十条“相关度”较高的结果,大量可能有价值的源搜索引擎的检索结果被忽视,影响检索结果的全面性。
Internet的发展使信息采集、传播和利用无论是从规模还是速度都达到了空前的水平。我觉得未来网络信息检索技术的发展方向如下:
1.智能化
现有的检索引擎存在着查全率和查准率低的问题,未来的搜索引擎技术必须具有能及时挖掘新信息和及时能链接新增的信息,多途径检索功能,用户可以交互式检索,搜索出满意的信息。提高网络信息检索技术水平并实现智能检索,智能化是网络信息检索未来主要的发展方向。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,智能检索技术就是采用人工智能进行信息检索的技术,它可以模拟人脑的思维方式,分析用户以自然语言表达的检索请求,自动形成检索策略进行智能、快速、高效的信息检索。最近几年,智能信息检索作为人工智能的一个独立研究分支得到了迅速发展,而且目前已有一些搜索引擎支持智能检索,但智能化程度还不高,这方面还有待进一步的发展。
2.标准化
现在的网站信息瞬息万变,杂乱纷繁,很是需要进行分类整理。目前虽然有大量的搜索引擎,但还没有一个统一严格的分类方法来管理,网络信息资源在组织分类上需要制定一个统一的分类标准。还要规范网络术语,提高资源共享的程度,这样可以有效保证用户的检索效率。
3.个性化