时间:2023-05-30 09:25:22
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇网络舆情监控,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)02-0046-02
网络舆情主要是利用互联网传播具备的公众性,针对实际生活中一些热点与焦点问题所具备的影响力和倾向性言论以及观点的等,通过社会舆论所表达的一个方式。因为网络舆情拥有传播速度快和影响力大等特点,所以应该创建自动化与现代化网络舆情的监控系统,从而确保网络舆情相关信息的及时、有效采集和分析以及监控等。另外,网络舆情的监控系统一般包含信息采集模块和预处理模块以及分析模块等,其中采集模块作为舆情分析和处理工作的前提,该核心内容就是利用一个或是多个并行采集设备从互联网中有效收集相关网页数据,而采集设备一般称之为网络爬虫或是网络蜘蛛。本文主要对网络爬虫与主题网络爬虫相关处理流程进行了分析,从而针对主题网络爬虫的相应设计模块结构完成优化,实现更为简单与有效的主体网络舆情相关信息采集系统的合理设计,并为网络舆情的采集与分析提供帮助。
1 网络舆情监控系统
现阶段,国内对于舆情并未形成相对统一的认识,有关教授针对舆情进行了定义,也就是舆情为舆论状况的简称,主要是指在一定社会空间中,人们对于社会事件与社会管理人员产生与持有的社会政治态度。而网络舆情可以有效、直接反映出社会舆情,其还是实现网上相关信息交流的主体,同时人们对于部分突发事件与社会所持有的态度以及发表的言论可能会在一定的时间内对社会造成严重影响,因此一定要及时采用有效对策,针对舆情实施严格监控,从而有效控制与引导事态良性发展。另外,舆情监控一般是利用网页自动选择舆情信息,然后利用文本挖掘等相关技术针对舆情信息完成有效分析与处理,并把处理过户获取的热点信息进行上报与跟踪,科学、合理的舆情监控可以实现舆情信息从被动防堵过度至主动疏导。
2 普通网络爬虫与主题网络爬虫分析
网络爬虫作为网络舆情监控系统中采集系统的核心与基础,其直接影响着网络舆情数据采集覆盖率与查准率等。依据采集内容和目标的差异,网络爬虫一般分成普通网络爬虫与主题网络爬虫。其中普通网络爬虫主要目标就是大量采集信息页面,在采集的过程中仅仅注重网页采集的数量以及质量,从不深入考虑网页采集相关顺序与被采集页面有关主题。近些年来,网络信息的不断增长,普通网络爬虫面临着严峻的网页规模和更新速度以及个性化等诸多方面的挑战。为了能够有效改进网络爬虫的工作效率,使其可以满足相关人群深层次和面向特定领域的信息要求,一定要充分应用主体网络爬虫。该目标是在大量采集和主体有关的网页基础上,在进行采集的过程中要时刻关注互联网页内容和主体相关度。
1)普通网络爬虫分析
普通网络爬虫是利用网页间存在的超链接关系有效采集网页,需要创建一个初始化的URL集合,其为一个有序的等待抽取的URL队列,然后从此队列中某一个URL开始,有效提取相应页面中的HTML内容,同时分析与提取在此页面中其他相关的全部超链接,把其分别加入至URL队列里,对之前的URL队列完成更新,然后依据图表中广度或是深度优先选择策略有效访问下一个URL连接,这样依次循环,不断重复上述过程,一直到全部网页都被提取完成或是依据Web爬取方案停止采集位置,该爬取流程图如图1所示。
2)主题网络爬虫分析
主题网络爬虫主要指有选择性的收集和目标主题存在关联的网页。应该针对主题完成向量表示,依据内容相关度有效计算出相应网页内容与主题的相关度,同时针对链接完成相关度评价,从而决定选择哪种网页。在进行采集时并不需求采集全部的网页,对此主题网络爬虫所需要保存的页面相对较少,能够在很大程度上节约相关硬件与网络资源,并且可以有效满足特定人们对查找特定主题的相关需求。另外,主题爬虫主要是在普通网络爬虫基础上实现相关功能的扩充,主要设置了针对URL与网页主题相关度的评价,主题网络爬虫工作流程如图2所示。
3 主题网络爬虫设计研究
主题网络爬虫只针对与主题有关的网页完成采集,并不是覆盖全部网页。应该先对主题完成向量表示,依据内容的相关度有效计算出所要访问的页面内容以及主题相关度,同时针对链接完成预测和分析,有效识别相关链接是否与主题有关,最后决定选择相应链接所指向的网页,同时设置提取链接的合理顺序。另外,主题网络爬虫整体运行流程比较复杂,首先要启动爬虫程序,然后输出主题和种子站点,完成主题的向量表示。其次获取网页的HTMT正文内容,并把网页输入至页面相关度的分析模块,有效计算出此页面和主题的相关度,并且把所提取到的相关页面链接和链接锚文本等多种有关信息输入至链接的评价模块中,通过测算相关度超过阀值的链接输入至链接的优先权队列中。然后依据链接选取对策,选取下一个进行访问的链接输入至爬行模块。最后,反复重复上述步骤,一直到满足相关结束条件为止。主题网络爬虫更为关注发现用户需求的信息资源,怎样更多获取和主题存在密切关系的网页,怎样在一定程度上提升采集效率都是主题网络爬虫系统设计的重要内容。另外,主题网络爬虫系统的设计应该以普通爬虫系统作为基础,然后在此基础上进行部分功能的扩充,依据主体网络爬虫相关功能需求与运行流程,设计的系统如图3所示。
4 主题网络爬虫关键技术分析
主题爬虫比较重视网页相关度,依据相应的网页分析算法有效过滤和主题并无关联的网页,并且保留和主题有关的网页和链接,从而更多的采集和主题有关的网页内容。对此,就应该科学、有效设计主题网络爬虫算法。
主题向量表示和关键词权值计算方式。主题一般利用一组关键词进行表示,同时主题关键词通常要在种子文档中获取。而种子文档主要由用户所指定的样例文档和种子页面相应文章以及种子页面实现相邻近区域扩展之后产生的文章等构成。另外,种子文档的产生过程比较复杂,增加种子页面所指向的页面,指向种子页面的页面实现种子页面的有效扩展,在扩展至一定条件过后停止,然后将用户输入至样例文档和种子页面文档以及扩展种子文档构成一个种子文档集,最后利用统计词频与逆文档频率(TF-IDF)手段针对种子文档集完成词频统计,同时还要实现权值计算,将权值最高的n个值构成主题关键词集,有效表示所给定的相应任务主题。
5 结束语
近些年来,主题爬虫技术在信息采集与数据挖掘方面的关键性日益突出,而且主题网络爬虫的研究和分析已经受到人们的高度重视。通过分析与研究普通网络爬虫与主题网络爬虫技术的特点以及处理流程,在满足相关功能要求的前提下,重点分析与研究了主题网络爬虫相关功能模块的设计以及所有模块的具备的作用。另外,还针对主题网络爬虫的相关度计算和主题向量表示进行了分析。但是对于怎样发现更多网页,怎样获取相关度更高的有关页面和提升主题网络爬虫工作效率,依然需要深入研究。
参考文献:
[1] 宋海洋,刘晓然,钱海俊,等.一种新的主题网络爬虫爬行策略[J].计算机应用与软件,2011,28(11):264-267.
[2] 魏晶晶,杨定达,廖祥文.基于网页内容相似度改进算法的主题网络爬虫[J].计算机与现代化,2011(9):1-4.
[3] 叶昭晖,曾琼,李强.基于搜索引擎的网络舆情监控系统设计与实现[J].广西大学学报:自然科学版,2011,36(10):302-307.
[4] 谢飞,吴信东,胡学钢,等.基于语义联系的新闻网页关键词提取[J].广西师范大学学报:自然科学版,2012,27(1):145-146.
[5] 刘金红,陆余良.主题网络爬虫研究综述[J].计算机应用研究,2010,24(10):26-29.
行业信息化
最佳舆情产品奖
中科点击秉承自主创新的理念,以坚强的党性、灵敏的嗅觉和高度的社会责任感与使命感,专注于垂直搜索引擎技术、海量数据分析挖掘技术、自然语言智能处理技术和网络渗透侦探技术等方面的研究和突破。
在全球一体化和互联网技术不断发展的背景下,如何提升突发事件应对能力,加强危机传播管理和口碑建设,已经成为各级政府部门、社会组织、企业及个人在新形势下的全新挑战。
中科点击(北京)科技有限公司(简称中科点击)秉承自主创新的理念,以坚强的党性、灵敏的嗅觉和高度的社会责任感与使命感,专注于垂直搜索引擎技术、海量数据分析挖掘技术、自然语言智能处理技术和网络渗透侦探技术等方面的研究和突破,经过近10年的研究与积累,开发出了具有自主知识产权的软件产品军犬软件(ADSoft)。
军犬网络舆情监控系统能够一站式地在第一时间针对境内、境外网站的各种网络载体(如新闻、论坛、博客、微博)等全面部控监测,经系统对海量数据进行智能分析、稳准狠快地把互联网读懂、读薄。其核心功能可总结为“352231”。
三大采集:定向采集,是指针对指定站点进行采集;非定向采集,是指针对特定关键词进行采集;境外采集,是指针对在国内不能访问的境外站点进行采集。
五大分析:包括分析是否与“某市”相关,是否属于“某市”舆情,是否属于“某市”负面舆情,是否属于热点舆情,以及每条舆情或某个事件专题的传播路径等。
二个平台:网络舆情专用平台、掌上舆情平台。
两种报告:指基于网络舆情平台中的数据、图表生成的简报专报。
三种预警:包括短信预警、邮件预警、弹窗预警三种方式。
一套标准:舆情业务办理标准。
该系统的成功开发与运用,为政府部门加强互联网信息监管,监测涉军(警)、涉独、反恐、维稳、打击“两非”,以及实现对重点组织、重点人群和重点信息的定向监测,应对突发公共事件,维护党、政府、单位、领导及地区形象,把握舆论导向,掌控社情民意,甚至引导网民的上网行为等均提供了坚强的技术保证,也为政府部门在当今错综复杂的内外环境和纷繁无序的互联网世界中拨云见日,掌握监管的主动权,提供了极大的便利与可能。
关键词:企业;网络舆情;监控工作;研究
一、网络舆论概念和特点:
网络舆论就是人民群众通过网络了解国家事务,广泛、充分地交流和发表意见、建议,对国家政治、经济、法律、文化、教育、行政等活动进行褒贬与评价。它的形成是依赖网络的各种功能而实现的。
(1)网络舆论的广泛性。 网络舆论的主体具有广泛性:相对于报刊、电台、电视台,网络提供的用于舆论监督的媒介资源不仅廉价易得,平台广阔畅通,而且几乎是用之不竭的。网民们可以在互联网上对众多事件进行大规模的讨论、批评和建议,,从而产生强烈的社会反响。
(2)网络舆论监督具有及时性。网络传播不受时间和空间的影响,世界上任何一个地方一旦发生新的情况,不必等待印刷,也不必等待发行,立即就可在网上,世界每个角落的人们可以立即获悉。人们只需打开页面,就可获得充分的新闻信息,所以大大加速了其传播的高效性和及时性。人们足不出户就可以在网络上直接参与到最近发生的事件的讨论中,网友的发帖、看帖、转帖几乎可以同时进行,信息的反馈十分及时。
二、企业加强舆情监控工作的重要意义:
舆情在很大程度上市一些关心民众切身利益的事情所引发的。随着媒体、互联网的盛行,人们的认知程度已经非常广泛,对事物的吸收程度很快速。往往有关企业某一事件发生,就会以很快速度在一定的时间范围和空间范围内引发民众的思考和评论。舆情所呈现的广泛影响性以及信息传播快速性、内容的偏差性在客观上已不是企业再沿用传统思维去化解的危机。如果再套用传统概念在舆情产生时,以堵塞言论、封闭信息等方式,只能造成不良舆论继续发酵、升级,让事态演变的不可挽救。
舆情监控工作可以为企业的工作决策提供依据和指导,及时化解新闻危机,帮助企业提升社会民众对工作实施效果的满意度。维护企业在社会中的良好形象。
三、企业中在新闻舆情管控上存在的问题:
(1)在宣传工作方面,过度依靠传统媒体资源,对以互联网为平台的新媒体系统缺乏足够认识与重视。在舆情工作中存在“报喜不报优”的现象。对事件问题类的舆情动态涉及较少。并且传播方式僵化、沟通渠道单一成为制约企业良性舆情管理的关键因素之一。新媒体通过扁平化传播系统可将信息、观点迅速大量汇聚,构建了基于个人通信终端的大口碑传播系统,而当下企业在进行舆情管理的时候对“人人皆媒体”的传播环境认知不足,很容易成为这些“自媒体”的质疑对象。
(2)是在企业机构设置中没有专业舆情管理机构或舆情管理机构不成系统。且舆情信息工作人员专业能力不足。很多企业舆情工作人员都是坐在办公室通过互联网简单的把舆情信息检索出来。他们既没有运用专门网络信息技术进行信息采集分析,也没有深入了解社会实际情况。这些舆情信息只是信息员凭感觉找到的。在处理舆情信息时手段也简单、粗放。会埋下重大新闻危机风险的“种子”一旦遇到影响严重的舆情事件发生,防控处置工作不到位,后果将会不堪设想。
四、企业舆情监控工作的工作对策
(1)指导思想上,企业必须将舆情管理从舆情消防员、救火队的角色定位中摆脱出来,不能仅仅等舆情事件爆发之后采用一些堵塞传播渠道、删除传播内容的方式来解决问题,而应在平安无事时进行常态化企业品牌建设,采取沟通的话语姿态,保持国有大型企业利国利民正面品牌形象。同时要不断进行与企业相关关键词的议题准备,建设企业品牌传播议题数据库,并将各类议题不断发送到各种媒介渠道中,保持与大众的沟通。
(2)工作方法上,企业要更加深入地将科学的调查分析方法引入舆情管理体系,充分发挥社会调查、数据挖掘、相关性分析等科学分析方法作用,从外宣内容设计与储备、内容的内部测试、媒体渠道的组合、社会效果的反馈等环节保证企业良性、长效的品牌建设;从负面舆情事件数据库建设、舆情应对中的内容准备、舆情内容的传播机制挖掘、舆情事件带来的教训与应对上保证在负面舆情爆发的时候与社会大众的沟通。
五、企业在舆情监控工作中的具体措施。
(1)加强官方媒体建设,建立具有快速反应能力的信息机制。面对此起彼伏的网络舆论事件,企业别是国有大型企业比较重视官方网站、报纸、杂志的传播价值,发挥其信息公开的作用。同时也在不断推动传统媒体探索传播改革,重建传统媒体公信力,特别调整传统宣传手法和话语模式,建立基于亲民、普适价值的话语体系,在此基础上致力于不断完善更具亲和力、更能够实现舆论引导的信息机制。
(2)不断提升与媒体沟通能力。一旦出现有关企业的敏感不实信息,企业可与媒体有效沟通,控制虚假、等信息的扩散;同时与媒体的良好关系也保证企业的正面形象可以通过各类媒体向社会传播。
关键词:网络舆情;应对策略;探讨
网络舆情就是现阶段的网络传播中,媒体大众和民众网友通过各种网络渠道对当下社会热点话题和公众关注的事件进行谈论、评论、发表观点和看法的一种现象。网络舆情是社会舆论的一种表现形式,随着网络的普及和广泛应用,越来越成为民众表达意见、发表不满、传递情感的一种主要方式。因此,网络舆情的引导和控制是确保社会稳定和民众心态阳光、健康的一种必要策略和手段。应对网络舆情应该从根源上严格筛选信息的健康程度和可传播性,对于已经造成一定影响的网络舆情要通过相应的方式应对、控制。
一、目前我国网络舆情现状与载体
网络舆情的社会影响力主要受到网民数量、参与人数等因素的影响。截止到2016年的统计数据,在我国,上网网民的总数已经达到了7.1亿,手机网民总数已经高达6.56亿。这在我国15岁到60岁的成年人9.4亿的人口比重中,网民数量的比例高达76%。由此可见我国网络信息化的发展程度和广泛程度。通过网络、手机网络S时随地的观看消息、关注社会热点、发表言论、已经成为成年人生活的重要组成部分。比较知名的新浪博客、百度贴吧、各大论坛等都在极力助推网络评论版块的发展,各种软件的手机客户端和微信、QQ也成为传播舆论的主要途径。
二、网络舆情的分类和营销
(一)社会事件和公众现象导致的网络舆情
网络舆情虽然是在网络上传播的一种言论,但是所谈论的话题往往是当下社会的热点话题和流行趋势。网络舆论是有针对性的针对某一社会状况和民众事件引发的大规模的谈论和思想导向。就目前网络舆情的统计分析,我国民众普遍关注的社会热点话题有社会养老、薪酬保障、公共医疗等。的网络舆情主要也是反应了民众切身利益的问题和有关政策策略。
(二)小道消息及虚假消息导致的负面舆情
由于社会舆情能够造成很大的社会反应和民众聚集度,有些社会事件造成的大规模网络舆情产生了一定的经济效益。有些不法分子就利用网络舆情造成的大规模的社会言论从中谋取不法利润。他们借助我国现阶段网络管理制度的不完善现状,钻空子、走偏锋,故意、蓄意捏造虚假消息和负面报道,有些甚至存在欺诈、勒索等犯罪事实,造成民众大规模的社会反响和反对浪潮。使网络环境形成了非常不健康、不文明的状态。
(三)真人真事与社会道德弘扬的正面舆情
除了负面、恶劣的网络舆情,还存在很多正面、积极的网络舆情。网络虽然更大比例是宣泄、、抒发不满、宣泄情绪的地方。但同时也是弘扬正能量、倡导社会善举的优良土壤。近年来,很多社会上的好人好事,乐于救人、见义勇为、绿色通道等好人好事也大量在网络中转帖、流传,大量的正面舆情不断跟帖、跟赞。网络舆情同时也宣传了很多正义、善良的新闻事件,在社会中也形成了效仿和认可的局面。
三、针对网络舆情应对的策略
(一)构筑大数据网络
要想更全面、更系统的控制网络舆情,就需要构筑大数据网络平台。目前我国网络舆情是把整个网络体系分散成一个一个的单元进行监管和控制,单元型的网络舆情监控在可控范围内能够发挥其实时控制的作用,但是由于单元型的网络监管只是局部的管控,单元和单元之间也存在一定程度的“空隙”,在“各自为政”的单元区域网络监控的状态下,很多边缘性网络舆论言论就容易蔓延、滋生。全局性的网络监控就越来越凸显出不健全和不到位,单元型的网络控制互相之间的沟通、协调大都不到位。而且各个信息系统的信息化档次和操作人员水平也参差不齐,构成了信息互联的巨大阻碍。因此,构筑大数据网络成为了必然要求。只有把单元区域的网络监管统一起来,才能够从全局上把握和掌控舆论的正面性和阳光性。有了大数据的互联互通,才能够实现数据库的完整共享并实现实时数据沟通。
(二)构建专业舆情应对体系
构建网络舆情应对体系首先应该升级网络舆情监测系统。不良社会效应的网络舆情很多都是从源头开始没有监管到位。由于网络大数据的信息量和数据量不断增长,信息传递的方式方法又呈现多样化、偏门化趋势,这样给舆情监管带来非常大的工作困难。怎样通过舆情监管把舆情信息有效、正确的筛选是初步选择。一般来说,目前我国舆情监管系统存在筛选不到位,新型信息数据录入不到位,信息抓取有疏漏,人工化、原始化严重,智能化水平不高等状况。但是面对一日万里的信息大爆发,现阶段的舆情监控水平完全不能跟上信息发展的速度。所以造成了很多负面舆情、不利言论在形成一定规模之后才大量进行删减、屏蔽。这样的舆情效率工作低下,不利于后期舆情应对和妥善处理。
(三)完善网络舆情法律法规,落实新闻发言人体制
要想强化网络舆情应对体系,还要落实新闻发言人体制。只有落实了网络舆情传播的首问责任,追究到源头,实名认证,有据可查,可以追朔源头,依靠法律法规的健全和完善,对蓄意传播具有恶劣影响的网络言论的不法人士依法惩罚。能够从源头就对新闻和言论的人产生一定的威慑力和约束力,每个网络言论传播人员对所传播的内容负责,从而实现舆情言论的良好控制。
四、结论
综上所述,网络舆情是随着网络信息的飞速发展和信息传递的高速运行而产生的一种新型的社会舆论问题,它是通过虚拟平台传递现实状况的一种体现。政府各个部门应该高度重视,从设备上、人员上和法律制度上不断的完善和健全网络舆情监管力度,从而实现网络舆情的正确应对。
参考文献:
[1]崔智慧.新媒体时代网络舆情的分析及引导策略[J],青年记者(中旬刊),2015,02(02):70-71.
关键词 网络文化安全;网络舆情;预警;智能分析
中图分类号TP393 文献标识码A 文章编号 1674-6708(2011)57-0213-02
0 引言
随着计算机网络技术及其应用的迅速发展,以数字内容为标志、以互联网为主要载体、以开放、多元、虚拟、交互为特征的网络文化,成为文化传播的主要形式之一。互联网在为人们提供大量的有用信息,给学习、生活带来便利的同时,也带来制造和传播不良甚至非法网络信息等新问题。在 Internet 普及的过程中,网民们积极参与网络讨论、自由表达个人观点、自主传播思想文化,从而形成网络舆情,网络舆情是社会舆情的直接反映。由于网络的开放性和虚拟性,决定了网络舆情具有直接性、突发性和偏差性等特点[1]。网络舆情的广泛传播常常导致现实社会有关事件的放大升级,甚至对事件的发展和结果产生巨大的影响力。针对网络文化中存在的安全威胁,实现对网络文化内容的有效监管,加强对网络舆情的及时监测和有效引导,成为当前亟待解决的问题。
1 网络文化安全预警系统模型构建方法
要保障网络文化安全,实现全面、准确、及时地掌握网络舆情,必须依靠科学的方法体系,运用信息化手段,构建网络文化安全监管系统,网络文化安全预警系统是其重要组成部分。
首先必须明确网络文化安全预警系统的性质和类型,采用科学的研究方法才能建立符合需求的应用模型,进而实现系统安全、可靠、有效的应用目标。
Internet安全对象不是一般的系统,而是开放、人在其中、与社会系统紧密耦合的复杂巨系统, Internet安全过程不是一般工程化的过程,而是一个时时处处有人参与的、自适应的、不断演化的、不断涌现出新的整体特性的过程[2]。因此,在建立网络文化安全预警系统时是由人、机和环境构成的人机系统,应采用“人网结合、人机结合”的模式,运用钱学森提出的综合集成方法[3],将各行专家的经验、知识与先进的数据挖掘、检测与阻断、模式识别、趋势分析等处理技术结合起来,充分发挥各自优势,建立基于“专家群体+数据信息+计算机技术+专家经验知识”的系统应用模型。图1为运用综合集成方法构建网络文化安全预警系统的理想参考模型。
2 网络文化安全预警系统总体框架
互联网技术的发展日新月异,威胁网络文化安全的网络犯罪日益趋向智能化、技术化,要保障网络文化安全,必须综合运用互联网技术、信息处理技术、人工智能技术及数据挖掘等技术。运用综合集成方法构建的网络文化安全预警系统模型分为支撑层、数据层、分析层和应用层四个层次,具体框架如图2所示。
3 网络文化安全预警系统模型分析
3.1 支撑层
支撑层由Internet和计算机软硬件平台构成,利用互联网技术,为系统上层提供海量数据源和信息处理平台。
3.2 数据层
数据层实现信息采集的功能,利用网络爬虫对互联网信息进行实时监控和采集,并进行有效的过滤和存储,建立网络舆情信息库。
信息采集是网络舆情分析的基础,采用纵向横向结合的采集方式,满足实时网络信息和互动信息源定点提取的需要。定向采集保证监控的深度和实时性,主要实现对新闻、论坛、评论、博客等设定站点板块的信息采集。全网采集主要通过搜索引擎进行广度采集,保证监控的覆盖面。对采集到的信息需要进行必要的预处理,如格式转换、数据清理、主题提取、相关性判断等,最后形成格式化信息,存储在数据库中。
3.3 分析层
分析层作为系统模型的核心层,主要利用人工智能和数据挖掘等技术实现对舆情信息的智能分析,生成舆情分析报告提交给决策机构实现智能辅助决策。
1)自动摘要
自动摘要是通过智能手段为文档自动形成摘要的技术,是进行信息抽取的重要形式,融合了数据挖掘和机器学习技术[4]。用户无需查看全部文档内容,通过该智能摘要即可快速了解文档核心内容,提高信息利用效率。主要采用基于统计与基于理解的方法,对舆情信息中各类主题、各类倾向形成自动摘要。
2)热点发现
根据舆情信息出处的权威度、评论数量、发言时间密集程度等参数,识别出给定时间段内的热门话题,利用关键字布控和语义分析,识别敏感话题。
3)主题跟踪
由于主题具有实时动态性,所以主题跟踪是一个动态学习过程。针对热点话题,实时地进行信息跟踪,分析网络上新发表的新闻文章和论坛帖子,关注话题是否与已有主题相同或类似。
4)趋势分析
通过对某个主题在不同的时间段内被关注的程度进行跟踪,可以获取舆情随时间的发展变化趋势或规律,以及地域信息分布,从而提供阶段性的分析,实现对舆情环境的监控和预警,进行适时控制和疏导。
5)倾向性分析
对每个主题,将各种信息进行自动聚合并利用文本聚类和观点挖掘技术对信息阐述的观点、主旨进行倾向性分析,判别信息的发展趋势,从而明确公众对相关热点事件所持的态度和倾向,以便帮助政府职能部门及时了解社情民意,做出及时反馈。
6)舆情分析报告
将智能分析的结果形成简报、报告、图表等智能舆情报告,为相关职能部门快速、全面掌握网络舆情爆发点和事态发展趋势,做出正确舆论引导,提供可信的分析依据。
3.4 应用层
应用层是人机交互层,一方面用户可以通过一定的软件环境对舆情信息的采集及舆情分析过程加以指导;另一方面则将舆情分析结果以直观、简洁的形式展现给用户,便于用户深入理解舆情信息,同时,提供信息检索功能,用户可以针对系统预设关键词进行定制查询,并能够根据指定条件对热点话题、关键信息及倾向性进行查询,采用多种检索方式,可以有效提高信息检索的准确率。
更为重要的是,应用层将结合智能决策系统实现对舆情信息的智能决策。针对热点信息与突发事件进行监测分析,构建趋势预测模型,根据知识库存储的先验专家知识进行推理判断,形成最终的舆情分析结果,进而实现舆情预警。同时,对每次舆情预警进行必要的评价,优化预测模型的参数,调整和完善知识库存储的知识,使预测意见更接近实际情况,提高舆情分析的准确率。
4 结论
本文针对Internet安全对象的特点,运用综合集成方法构建了网络文化安全预警系统模型。该模型采用纵向横向相结合的采集方式,保证了对互联网海量信息监测的深度、广度和实时性,运行人工智能、数据挖掘等技术和智能决策系统对舆情信息进行智能分析和智能决策,发现网络热点问题并实时跟踪,从而实现对网络文化安全态势的预报和对危机的快速反应,通过舆情评价模块将有助于完善系统模型,提高预警的准确率。
参考文献
[1]张虹.基于统计分析和知识挖掘的网络舆情管理决策平台研究[J].科技信息,2011(7):495,502.
[2]何德全.互联网时代信息安全的新思维[J].科学中国人,2003(1):14-15.
关键词:军队医院;网络舆情;策略
Strategies and recommendations for Military hospitals cope with the Network Public Opinion
LI Jie,LI Zhi-jun,CHEN Jie
(The 113rd Hospital of PLA,Ningbo 315040,Zhejiang,China)
Abstract:Timely response to military medical network public opinion, correctly guide online public opinion and to deal effectively with the network of public opinion crisis, is a new task for military hospitals to face. This paper analyzes the main characteristics and the way to deal with public opinion related to military medical activities, and put forward suggestions on how to prevent it for military hospitals.
Key words:Military hospitals; Network public opinion; Strategies
近年来,互联网已成为思想文化信息的集散地和社会舆论的放大器,特别是一些医疗纠纷、医患矛盾的信息逐渐成为网上热议的焦点。军队医院作为军队单位的特殊性,如果对网络舆情不加以及时引导,采取有效应对措施,在网络媒体的炒作下,极有可能给医院工作带来被动,甚至对军队形象声誉造成影响[1]。因此,如何适应网络化、信息化的挑战,不断提升快速应对网络舆情、正确引导网上舆论的能力,是当前军队医院面临的一项十分重要和迫切的新任务。
1网络舆情的含义
网络舆情是指在互连网空间中,网民针对某一焦点热点问题公开表达具有一定影响力和倾向性的意见。涉军医疗网络舆情就是患者和民众通过互联网传递对军队医院医疗行为和管理工作的态度、意见和情绪。
2涉军医疗网络舆情的主要特点
目前涉军医疗网络舆情主要有以下三个方面特点:
2.1突发性强 在医患关系日益紧张的背景下,医患矛盾热点事件一旦发生,网友就会很快将自己所看到的记录下来,然后通过手机短信、微博、论坛,网络聊天等形式传播出去。在网络世界中,传者与受者的身份比较模糊,这种特点就造成了网络传播的传受同时性,加速了网络传播速度。在官方消息不确切、语焉不详的情况下,更促使网民传播自己的揣测。
2.2涉及面广 因互联网具有虚拟、开放、互动等特点和优势,网络信息可以跨越时空、地域的界限,深入社会生活方方面面,已经成为人民群众了解信息,沟通交流的重要平台,网民人数巨大,方式互动,网络舆情表达快捷,热点信息迅速得以大范围广泛传播。
2.3控制难度大 互联网为网民提供了论坛、博客、聊天等交流平台,网民可以利用互联网的匿名性、隐蔽性特点进行无限制的自由传播,甚至发酵、放大、变形,而这种传播往往难以在短时间内得到及时有效的控制。
3应对涉军医疗网络舆情主要策略
当涉军医疗网络舆情发生时,要能够迅速查找与舆情相关的医疗救治信息,仔细研判医院在医疗救治过程中是否存在舆情所反映的问题,及时对所涉及的事件予以解释澄清,快速妥当处理舆情事件,以维护军队医院的形象。
3.1反应要迅速及时 面对涉军医疗网络舆情,医院主管部门要立即采取措施,快速、准确获取相关信息,全面了解情况,掌控事态发展[2],及时正面澄清事实,引导网络舆情朝着正面的方向发展,缩短影响时间,控制影响范围,避免事件进一步扩大化、复杂化。
3.2措施要得当有力 一旦发现网络舆情,监管人员应及时向各级领导和相关部门汇报情况,医院需立即找到涉事科室和人员全面了解情况,及时与患者及家属进行沟通,处理相关意见,化解矛盾纠纷。同时加强与地方媒体和网站的联系沟通,借助媒体渠道,对损害军队医院形象的虚假报道进行辟谣,正面维护医院良好形象。也可根据网站的流程,通过正规途径进行删除申诉,或者联系发帖人,进行有效沟通,请发帖人主动删帖。
3.3方法要讲究灵活 在处置网络舆情时,医院要换位思考,从患者的角度出发,倾听患者的网络诉求,要尊重事实,讲究客观。对患者或家属过激的言论,要从医学专业的角度,耐心予以解释,阐明医疗过程中所采取救治方法的正确性和合理性,在相互沟通中求得理解。
4预防涉军医疗网络舆情的几点建议
4.1建立网络舆情监管机制 针对涉军医疗网络舆情的特点,医院主管部门要高度重视,成立网络舆情处置领导小组,成员涵盖医院领导、医务部门、宣传部门、临床科室、辅诊科室和信息科,明确职责和分工,同时加强与上级保卫部门、地方公安部门、网监部门的沟通,多种渠道推动工作高效开展[3]。
4.2建立信息机制 要严格规范医院对外宣传和公共信息审批流程,依托医院门户网站正面宣传服务政策和医疗技术,正确引导舆情方向。
4.3建立舆情监控机制 制定网络舆情监控实施办法,指定专人负责对主流门户网站以及本地网站的新闻信息和互动类网络社区、论坛实施动态监控,及时掌握了解网络舆情动态并上报主管部门。
4.4建立应急处置机制 制定医院网络舆情应急处置预案,明确处理原则、工作方法、上报流程等内容,把责任落实到人。舆情热点出现后,按照准确、及时、透明的原则,根据网络舆情类别和等级,及时启动应对预案。
4.5抓好网络舆论主流阵地建设 大力加强医院门户网站建设,打造医院网络舆论主流阵地,切实加大医院网站对网民的宣传力度,确保在网络宣传上占据优势地位。并加强和媒体的沟通。主动与主要网络媒体建立沟通渠道,确保正面的、权威的信息始终占有主导权。
4.6建立网络舆情应对骨干力量 医院成立基于各医学专科的网评队伍,负责医疗信息工作,并在网络舆情热点事件出现时,负责网上发帖、跟帖和撰写发表网评文章等,利用专业知识及时开展正面引导。并加强对医护人员的网络舆情应对方法培训,开设网络知识、网络公共危机应对技巧与策略等课程,切实提高医院广大医护人员应对处置网络舆情的能力。
参考文献:
[1]杨晓兰,夏锡仪,卞晓星,等.医疗机构应对网络舆情的策略[J].江苏卫生事业管理,2011,22(1):80~81.
摘要:本文以基于数据挖掘的决策支持系统方法整合网络舆情信息,建立网络舆情信息仓库,对非结构化的模糊复杂的信息,运用数据挖掘中文本挖掘技术有效分析网络热点事件的舆情,及时发现重大突发事件,减少危机损失,提高政府管理和监控舆情危机的能力。
关键词:网络舆情 数据挖掘 决策支持系统
1、引 言
近几年,随着Web2. 0的兴起与普及,互联网已成为一个开放的、个性化的社会环境形态,对社会稳定和国家安全的维护带来了严峻挑战。但是现在我们政府情报机构网络安全管理和监控能力比较薄弱,难以适应复杂的环境。因此,建立基于数据挖掘的网络舆情预警决策支持系统,对非结构化的模糊复杂的信息,运用文本挖掘技术有效分析网络舆情事件,及时发现重大突发事件,减少危机损失,提高政府管理和监控能力势在必行。
2、基于数据挖掘的决策支持系统
决策支持系统(DSS) [1]是利用大量信息,数据结合众多模型,通过人机交互,辅助各级决策者实现科学决策的系统。它是融计算机技术、信息、技术、人工智能、管理科学、决策科学等学科和技术于一体的技术继承系统,包括数据仓库和数据挖掘分析系统,由以下三个主体[2]组成:
(1)模型库系统和数据库系统结合,作为该系统的基础,为决策问题进行模型计算和定量分析,提供辅助决策信息。
(2)知识库系统和数据挖掘的结合,从数据库和数据仓库中挖掘知识放入专家系统的知识库中,通过知识推理定性分析,辅助决策。
(3)数据仓库和OLAP,从数据仓库中提取综合数据和信息来反映了其内在本质。
3、基于数据挖掘的网络舆情预警决策支持系统的定位
从网络舆情预警决策支持系统的功能和实现方式对其定义:基于决策支持系统技术,将联机分析处理、数据挖掘模型(文本挖掘模型)、数据仓库、知识库、方法库等相结合,应用于情报机构的网络舆情预警中的人机结合系统。
3.1数据仓库
数据仓库[3]的设计要满足决策支持系统的要求,即数据要具备概括性、抽象性、统一性三个特点。所以图1中数据仓库和部门数据库加上一个虚拟层,实现数据挖掘的数据清洗,为数据仓库提取有用数据。
3.2数据挖掘方法
数据挖掘[4],简单点说,就是从大量数据中寻找规律的技术,通过处理海量的、不完全的、随机的、结构复杂的数据选择有用数据,建立知识模型。网络舆情预警决策支持系统运用数据挖掘中文本挖掘技术,包括自动分类技术、自动关联技术、观点挖掘技术、自动分词技术、结构化抽取技术以及自动摘要、关键词技术等。
图1 决策支持结构系统
4、基于数据挖掘的网络舆情预警决策支持系统的构建
基于数据挖掘的决策支持系统采集网络中的新闻网页、论坛、博客、新闻评论,贴吧等网络资源,发现突发性热点事件,进行热点跟踪定位和实时舆情预警,帮助政府及时掌握舆情动向,准确捕捉预警信息,对有较大影响的重要事件快速发现、快速处理,为政府决策提供信息依据[5]。
4.1数据准备
网络舆情预警需要多样化的信息,在整理信息的时候,需要做到全面、准确、及时。本系统涉及的信息有:
文本信息:新闻、博客、产品评论、论坛帖子等文本信息,包括主题、关键词、时间、URL等。
词汇信息:包括现在词典中的字或词和现在网络用语的语义、适用的语境和是否带有情感等。
图像信息:主要是新闻、博客、产品评论、论坛帖子等上的图片,包括主题、内容、时间、URL、浏览数量等。
视频音频信息:主要是新闻、博客、产品评论、论坛帖子等上的视频音频,包括主题、内容、时间、、URL、浏览数量等。
这些来自互联网的大量信息,通过收集、整理、存储、预处理在数据库中作为原始数据,这些数据是离散的、模糊的。
4.2系统功能模块
根据网络舆情预警的规划,如舆情分类、情感分类与趋势预测、舆情检索以及统计分析等,本系统建立了舆情信息采集管理系统、舆情分类管理系统[6]、舆情来源管理系统、舆情情感分类管理系统和用户管理系统。
①舆情分类管理系统:舆情分类即对海量信息的自动(文本语义分析)分类。通过关键字样本、文件样本、自定义等把原始信息分类,形成分类别(危害国家安全、危害社会治安、扰乱社会秩序等)的分类库,分类管理可以对分类的类别数据进行增加、删除、修改等操作。
②舆情信息采集管理系统:舆情信息采集管理系统对文本信息、图像信息、视频音频信息的来源,如新闻、博客、产品评论、论坛帖子、网站及其网站的权威性进行分析统计。
③舆情来源管理系统:舆情来源管理部门对文本信息、图像信息、视频音频信息的来源,如新闻、博客、产品评论、论坛帖子、网站及其网站的权威性进行分析统计。
④舆情情感分类管理系统:舆情分类管理部门从根据新闻、博客、产品评论、论坛帖子等收集的文本信息、图像信息、视频音频信息,经过预处理之后,通过观点挖掘方法对舆情信息的情感倾向进行分析,及时发现消极情感的信息,以便迅速做出反应。
⑤舆情统计系统:统计舆情分类管理系统和舆情情感分类管理系统的信息,为政府提供报表或报文,供政府决策使用。
5、结 论
基于数据挖掘的网络舆情预警决策支持系统可以有效解决现在网络舆情预警系统中存在的问题,通过文本挖掘技术对非结构化的模糊复杂的信息分析处理,及时发现重大突发事件,减少危机损失,提高政府管理和控制舆情的能力。
参考文献:
Design Ideas and Works .NET 3.5 Web-based Information Collection System
Tang Jing Peng Chun-fu
(Changde Vocational Technical College HunanChangde 415000)
【 Abstract 】 Modern society is an information society, to acquire the necessary information is the premise to discover and solve problems. How to assemble a network of information resources? The need to establish a network information collection system, will be scattered in different institutions of the residents'' health data into a logical and complete information as a whole, the level and quality of urban and rural health care services to improve the trust of the residents of the primary health care institutions, and urban health efficient use of information has an important social significance. From the introduction. NET3.5 about, then, respectively, based on design ideas and works of the NET 3.5 Web-based information acquisition system is described.
【 Keywords 】 .Net3.5 network information collection system design idea works
0 前言
网络信息采集系统是指通过对网络各类信息汇集、分类、整合、筛选等技术处理,再形成对网络热点、动态、网民意见等实时统计报表的软件系统平台。网络信息采集系统可以提供信息汇集服务,机构及工作人员可以充分利用计算机网络自动信息采集功能来收集相关信息,系统根据用户信息需求,设定主题目标,使用人工参与和自动信息采集相结合的方法完成信息收集。
1 .NET3.5概述
1.1 .NET3.5的特性
.NET 3.5主要特性。
1)可以实现深度整合语言级的数据集成查询(LINQ)与数据处理。
2)可以借助ASP AJAX创建更高效、更具交互性、更有个性的网络体验,并支持大多数流行的浏览器。
3)支持AJAX、JSON、REST、POX、RSS、ATOM等新型网络协议,以及一些新的WS标准,用于构建WCF服务。
4)全面提供WWF、WCF、WPF工具支持,包括新的工作流服务技术。
5)在基类库(BCL)中添加了很多新的类,可以更好的满足大多数客户的需求。
1.2 以.NET3.5技术框架为基础的系统总体框架
2 基于.NET 3.5的网络信息采集系统的设计思想
2.1 网络信息采集系统的设计思路
各种网络信息采集系统的详细设计思想可能不太一样,但是基本的设计思路是一致的,下面就以通用的网络信息采集系统为例子,介绍一下网络信息采集系统设计的基本的步骤。
第一步:确定采集任务。
第二步:针对不同的目标数据源,进行不同的采集配置,以确保能采集到数据。
第三步:调度采集任务,与目标站点同步更新,增量采集。
第四步:采集到数据结果,完成数据异构到同构的过程。
第五步:通过服务器,将数据到应用平台。
2.2 网络信息采集系统的设计方案
网络信息采集系统通过对热点问题和重点领域比较集中的网站信息,如网页、论坛、BBS等,进行24小时监控,随时下载最新的消息和意见。下载后完成对数据格式的转换及元数据的标引。对下载本地的信息,进行初步的过滤和预处理。
〔摘 要〕食品安全事件是涉及民生的敏感事件,食品安全舆情是公众在媒介信息技术高度发达的风险社会中不安全感的集体释放,是
>> 我国食品安全网络舆情监测技术体系探析 食品安全网络监控系统设计研究 新媒体时代食品安全舆情引导机制研究 论健康教育在食品药品安全网络舆情应对中的运用 “一票通”构筑甘肃食品安全网络 浅析食品安全网络服务管理信息系统的构建 信任重塑与协调共生:食品安全网络化治理的逻辑 增强对食品安全网络谣言的“免疫力” 食品安全网络谣言的治理对策初探 我国银行业监管与安全网构建 我国食品安全报道研究综述 我国食品安全政府规制对策研究 我国食品安全监管研究 我国食品安全的政府监管研究 我国食品安全问题监管研究 我国食品安全监管问题研究 我国食品安全监管体制研究 我国进口食品安全问题研究 我国食品安全犯罪法律控制研究 我国食品安全监管模式研究 常见问题解答 当前所在位置:l,2011-04-11.
[9]丘盘连,王荣,李晓峰.从网络舆情中“淘宝”,服务和谐社会建设[J].新闻知识,2006,(12):9-10.
[10]张丽红.试析网络舆情对网络民主的影响[J].天津社会科学,2007,(3):60-62.
[11]王来华.论网络舆情与舆论的转换及其影响[J].天津社会科学,2008,(4):66-69.
[12]刘泽西.科学面对网络舆情[N].西安日报,2009-01-19,(010).
[13]汤晓寒.传统媒体如何应对网络舆情[J].视听纵横,2010,(3):55-56.
[14]朱恒民,李青,洪小娟.网络舆论生成危机的诱发因素[J].南京邮电大学学报:社科版,2011,(2):16-19.
[15]Ajzen I.The Theory of Planned Behavior[J].Organizational Behavior and Human Decision Process,1991,(5):179-211.
[16]中国互联网络信息中心.第32次中国互联网络发展状况统计报告[R].2013.7.
[17]吴林海,徐玲玲.食品安全:风险感知和消费者行为——基于江苏省消费者的调查分析[J].消费经济,2009,(2):42-44.
【 关键词 】 负面消息;文本倾向性分析;网页权重;追踪
1 引言
在当今媒体传播手段多样化、网络化的时代,要让一个企业的负面新闻事件,一夜传遍网络世界是非常容易的。一旦您的客户或潜在客户通过搜索引擎(例如百度、谷歌、搜狗)看到那些负面信息,后果将是很严重的。对企业来说,危机一旦爆发,其破坏性的能量就会被迅速释放,并呈快速蔓延之势,如果不能及时控制,危机会急剧恶化,使企业遭受更大损失。 企业为避免或者减轻危机所带来的严重损害和威胁,维护自身的形象,必须有组织、有计划地学习、制定和实施一系列管理措施和应对策略,进行危机公关处理。国际知名网络营销实践者敖春华曾提出四种常见处理方式:①利用搜索引擎压制负面消息;②利用公关删除负面消息来源;③结合事件本身制定根本性解决方案,利用公关彻底平息事件;④舆情监控,第一时间妥善处理相关问题,切掉危机滋生的温床。在当前信息传播方式多样化的今天,企业的危机公关工作也遇到了巨大的挑战,调整、改进危机公关工作,加强危机的事前、事中、事后管理是企业求得生存和发展的必由之路。加强危机事前管理可以及早发现危机因素,并且采用相应的方式消除这些因素,把危机化解在萌芽阶段。这种事先预防,对于企业而言是最经济、最有效的手段。
本文据此对第四种处理方式——舆情监控进行研究,企业需要建立自己的舆情监控系统,通过互联网,随时监控各类行业、专业网站上的信息,对这些信息进行文本倾向性分析,及时发现有利或者不利的信息,尤其是一些不利的负面信息,要进行网页权重、转载、传播途径的追踪。企业公关据此可以及时做出相应的危机处理。
2 网络舆情的获取
企业根据特定需求采用垂直搜索引擎,针对某一特定领域、某一特定人群或某一特定需求搜索相关的有一定价值的信息。具体来说,企业根据特定需求预先录入特定网站( 国内主要网站、论坛、博客)的URL,日常一般设置为本企业的机构名称或部门领导名字即可;在舆情爆发期,可根据舆情主题关键词来进行设置,准确捕获舆情动态信息。采用分布式爬虫系统,主控制器读取URL并分发到不同爬虫机器上,爬虫从JOB队列取出URL,不断从一个站点移动到另一个站点,自动建立索引, 索引进程通过预先设定关键词,利用分词处理技术进行内容分析并建立索引。(索引通常采用开源程序Lucene),并加入到网页数据库中.网络爬虫进入某个超级文本时,它利用HTML语言的标记结构来搜索信息及获取指向其他超级文本的URL地址,可以完全不依赖用户干预实现网络上的自动“爬行”和搜索。网络爬虫在搜索时往往采用一定的搜索策略,譬如广度优先搜索策略、深度优先搜索策略、聚焦搜索、基于内容评价的搜索策略等,企业可以根据监控重点采取不同的策略。
3 对获取的网页进行文本观点倾向性分析
文本观点倾向性分析是网络舆情分析的核心之一。目前,对于观点倾向性分析方法而言,英文已经有较好的研究基础,而由于中文与生俱来的特点,在中文上的观点倾向性分析仍需不断深入研究。中文观点倾向性分析研究上普遍采用基于情感词汇语义特性的识别方法来判断文本的观点倾向性,如根据已有的情感词典中词汇的语义倾向对未知词语进行倾向性判断,或者研究者自己构建情感倾向性词库,对未知词进行极性分析;在此基础上,也有研究者进一步提出识别情感词倾向性强度的方法,如采用多种分类方法将文本强度分为几个等级( 常见的强烈反对、一般反对、中立、一般赞成、强烈赞成等五个类别)等方法。
我们可以采用中科院的ICTCLAS分词系统,ICTCLAS的分词正确率高达97.58%(最近的973专家组评测结果),基于角色标注的未登录词识别能取得高于90%召回率,其中中国人名的识别召回率接近98%,分词和词性标注处理速度为543.5KB/s。
该分词系统的主要思想是先通过CHMM(层叠形马尔科夫模型)进行分词,通过分层,既增加了分词的准确性,又保证了分词的效率,共分五层,如图1所示。
基本思路:先进行原子切分,然后在此基础上进行N-最短路径粗切分,找出前N 个最符合的切分结果,生成二元分词表,然后生成分词结果,接着进行词性标注并完成主要分词步骤。
4 文本词权重的计算
对文本进行了倾向性分析后,还应该考虑同类文本词的权重,权重的计算采用TFIDF计算公式。其指导思想是:在一个文本中出现次数越多的单词,在另一个同类文本中出现的次数也会很多,反之亦然。该方法是根据特征词的重要性与特征词的文档内频数成正比,与训练文档中出现该词条的文档频数成反比的原理构造的。常用频率因子和文档集因子的乘积表示:
对于它们的计算方法,目前有很多种,较为常见的公式
其中Yi为页面i的或转发的影响力,PRi为页面i的受关注度,MRti为页面i被转载数,a,b,c,d为待求参数。这里可以考虑一个页面的转载数和影响力的影响程度十分相近,因而近似求和。
我们可以根据以上公式找出网页转载、传播的路径。
6 结束语
对于企业来说,危机与机遇并存,危机的危害性莫过于网络舆论,所以企业要建立自己的网络监控系统,一旦发现危机,可以通过上述方法及公式可以找出负面消息的与传播路径以及网页权重,针对不同的权重,采取不同的危机公关。当然,上述方法中没有考虑负面评价的重复率以及网页非法操作PR值的行为。
参考文献
[1] 孙挺,耿国华,周明全.一种有效的特征权重计算方法[J].郑州大学学报(理学版),2008(12).
[2] 张俐,李星,中文网页自动分类新算法[J].清华大学学报(自然科学版),2000年第40卷1期.
[3] 过仕明.PageRank技术分析及网页重要性的综合评价模型[J]. 吉林大学管理学院,2006(2).
[4] 王来华.舆情研究概论[M].天津:天津社会科学院出版社,2003.
[5] 任伟,无线网络安全问题初探.信息网络安全,2012(1),10-13.
[6] 吕斌斌,包震斌,张明乐.基于SNMP协议的网络拓朴发现算法分析.信息网络安全,2012(1),46-49.
作者简介:
[关键词]舆情监测;系统框架;网络环境;模板功能
中图分类号:TP391.1 文献标识码:A 文章编号:1009-914X(2016)15-0306-01
2016年1月22日,CNNIC(中国互联网信息中心)我国第37次《互联网发展状况统计报告》,该报告中指出,截止到2015年底,我国网民的总数量已经达到6.88亿,年增长率为6.1%,计算机、互联网在国内的普及率超过50.0%,数据表明我国互联网的普及速度较快,手机、电脑等移动终端已逐步覆盖于人们生活,只要在有网的情况下,人们接收、传播信息的速度将会变得更快。极大程度改变人们沟通交流方式的同时,也对网络舆情监测提出了更高要求。
1.网络舆情监测系统发展研究现状
互联网是一个全开放型的交流平台,与传统媒体相比,传播信息的速度更快,同时人们也可通过微博、论坛、贴吧等平台,成为传播信息的主体,这也加速了网络舆情的形成。受到网民素质、网络环境等因素的影响,网络中仍存在很多不良消息,如暴力、恐怖等,如果被某些不法分子利用,将会造成极大的网络动态,导致社会中存在不稳定因素。因此,相关政府必须加大对网络舆情监测的重视程度,采取针对性解决措施,为网民创建更安全的环境。
网络舆情监测工作在国际中发展历程较长,最为传统的监测手段一般采取手工操作,以人工方式为基础,通过员工监测指定页面的方式,检索出页面中重点监测词汇,从而寻找出最新的舆情动向。随着互联网的飞速发展,该种监测技术已经不能适应大量信息的需求,基于此,TDT研究项目产生,其核心内容包括话题追踪、监测、报告及关联监测等。
2.构建系统模块框架
构建网络舆情监测系统框架,需要广大技术人员与政府机构共同努力,结合我国网民实际需求,不断健全系统监测模块,营造良好的网络环境。从监测过程及程序的角度分析,其框架本质为获取收集数据、整理数据、依据不同用户要求分析,整个系统模块的构造如图1所示[1]:
2.1 收集数据模块
收集数据模块是网络舆论监测系统框架最基础的模块,主要发挥着获取网络信息的功能,具备全天候不间断收集、自动收集等特点,既可收集整个网络也能指定网络进行收集。在收集的过程中,应注意以下两方面的事项,一是尽可能获取最为全面的数据,保障数据的完整性与原始性;二是提升数据收集的准确性与可靠性,所有被收集的数据应尽量符合网络用户关注的舆论热点,满足以上两个条件后,才能更好地进行舆情预处理与分析。
当前,收集数据的方式主要有以下两种:一是网络爬虫技术[2],HTML协议作为互联网中基本协议,以URL(统一资源定位符)为基础,将互联网中绝大部分资源联系起来,形成一个完整的整体。而网络爬虫技术是指从预先设置好的URL列表出发,按照顺序对列表中页面进行访问并获取数据,并通过分析页面中其他URL,并智能选择出符合系统要求的URL,将其放到待访问队列,通过遍历式访问,搜查限定范围,更为精准的获取数据;二是元搜集技术,搜索引起是大多数用户进入网络的途径,随着互联网技术的飞速发展,提供搜索引擎的服务商越来越多,通过对不同的搜索引擎设置元搜索的方式,从而更为广阔的收集不同引擎间的数值,该种技术构建简单,且数据获取准确率较高。
2.2 预先处理数据模块
网络页面中存在的数据较多,且具有自身特点,包括描述与内容两种,属于半结构化形式的数据,如果直接对已获取的数据进行分析,将会增加其分析难度,因此,需对数据进行预处理,主要包括以下两个步骤:首先,提取网页中热点内容,从噪音中摘取出用户关注的新闻或者其他内容,并将其转化为HTML标签树[3],并建立出对应的提取规则;其次,进行文本分词环节,对于页面中获取的连续、非结构性文本进行对应处理,使其更加规范化。
2.3 整理数据模块
整理分析数据模块是系统框架中最为核心的模块,具备主题聚类、发现热点、等方面的功能。基于主题聚类而对角度分析,聚类能够更为直观的展示新主题,并将整理过后的内容归结到同一特征的空间中;发现热点主要是指发现人们舆论关注点,在互联网的时代背景下,网络中的舆情主题无时无刻不在变化,而舆情监测系统能够将热点问题从诸多主题中科学选择出来,并合理推送到舆情分析工作人员手中。整理数据模块的过程中,工作人员应注意填写好网络舆情监控登记表,具体模块内容如表1所示:
2.4 呈现结果模块
呈现结果模块主要是为科学展示网络舆分析,并为决策提供参考依据,经过分析的结果能够更为简单的传递到决策工作人员手中,其具备以下几方面的功能:查询所有针对性主题;推送最新网络主题;警告拐点或舆情热点;舆情发展变化情况等。
3.结束语
综上所述,随着计算机技术的飞速发展,人们对互联网的依赖程度越来越大,因此,相关政府机构须加大对舆情监测系统的重视程度,结合网络信息传播特点,遵循监测系统运转程序,即收集数据、预处理数据、整理数据、呈现结果数据,在这个过程中,应从以下两方面展开工作。首先,对于收集数据而言,应尽量拓宽监控网页种类,通过搜集社区网页、论坛数据的方式,更广泛、全面的获取专业网络舆论数据;其次,对于分析、决策舆情而言,须以数据挖掘、语言处理等技术为前提,加入自动摘要、热点搜索、智能搜索等用户高级需求,进一步扩展舆情报警等功能,创建出更为和谐的网络环境。
参考文献
[1] 董天策.网络公共事件研究的符号学路径――《网络公共事件:符号、对话与社会认同》序[J].新闻研究导刊,2015,22:200+189.
《中国社会舆情年度报告(2015)》公布的数据显示,2014年网络舆情热点事件虽然较前两年有所下降,但总计仍达381个,民生问题、公权力运行及个体官员的言行等的焦点问题仍是舆情发酵的重点范畴。从2003年网络舆情标志性事件“孙志刚事件”的发生至今,随着政府执政能力和应急管理水平的提升,应对的危机公关能力得到了长足发展,但是囿于基层政府本身的性质与职能,短时期内面临诸多困境局面仍然难以打破。年度发展报告表明,处理舆情危机已成为政府进行社会治理(人的治理)自我修复自我完善的重大课题。
舆情不是敌情,只是信息社会发展到一定阶段的常态表现,学好舆情处理这门必修课,掌握正确的打开“姿势”是可以避免次生灾害,妥善平息事态的。
一、先知先觉 舆情研判常态化
政府各职能部门要建立预警机制,针对近几年本单位本部门发生的突发危机事件进行归类总结,找出事件的共同点属性以及预防方法。
要强调的是,媒体是社会的预警装置。现在舆情传播的主体模式为移动媒体发端,网络媒体爆料,传统媒体跟进。而尤其是自媒体的发展方向具超常规性和复杂性,往往“节外生枝”改变延伸方向引爆新的热点,因此,监控舆情监控更应日常化,增设人工或者委托第三方机构,通过技术手段和人工手段监测的方式对网络信息进行监控,也可以与相关监测部门建立联系,时时监测动态。监控内容主要有三类对象:一是主流平面媒体、门户网站、垂直类网站;二是Web2.0生态产品如bbs、论坛、热点博客等延伸产品;第三类是搜索引擎收录。一旦评估指标达到红线立即做出预判(性质是否严重)、预警(如何处置)。
二、提前主动 快速处理切割责任
在事件处理层面,重大责任事故,尤其事关大是大非、国家行为、历史认知、民族情感、意识形态等重大问题,需要省级领导争取在中央介入之前,以本地的力量迅速彻底全面地完成事故调查、处理和善后,以最高的效率平息事态,争取上级领导部门和民意的认可。政府主管领导亲赴现场指挥,职能部门高效介入有助于控制事态,稳定人心。
对于投诉类等一般民生事件,比如宰客、医疗事故等,民众传播大多还连带职能部门行为失范、管理者不作为等“吐槽”,这种连带诉求极具转化为核心舆论点的可能性,基本上难以忽略掉,这就需要主管部门主动细致地进行“不护短”调查,清楚责任关系,及时切割责任,即上级政府“切割”下级政府不良行为,政府“切割”不良官员,将负面影响框定在具体范畴内。对捍卫政府整体和体制公信,收拢事态手段非常有效。而保护和遮盖只会引爆更大的危机,因为“捂盖子”才是最大的恐慌源,在出现信息真空时极易引发民众大规模的质疑和谣言。
要特别注意的是,舆情应对要慎用行政压制。删帖或企图管控所有言论出口已然是最低效的处理方式;而封口党管媒体任由网络舆情“烂尾”的消极沉默则贻害无穷;以“抹黑地方形象”、“影响社会稳定”等扣帽子,则极易将社会治理可分解消化的压力引入意识形态领域。
此外,因管理体制设置的先天因素,一个热点事件需要多部门联动处理。解决一个实际问题需要多个环节牵涉多个部门,需要党政各职能部门联动,建立磋商或联席会议制,明确责任分工,避免互相推诿延误时机。
三、坦诚回应 避免简单粗暴烂尾
在传统危机公关中,公关事件为6-18小时,但在人人都是麦克风的自媒体时代,危机公关的响应速度须以小时计。第一时间发出权威声音,对公众进行得体完备的回复,仅仅由宣传部门唱独角戏是远远不够的,重点的舆情事件具有的复杂性要求必须成立信息全备的应对小组。由有外宣经验的人负责对外信息,内部组成包括事故熟知度最高的现场人员和调查人员。
坦诚回应公众实质关切点的基本原则是:速报事实,慎报原因,频报进展。新闻发言人要有良好的心理素质和职业能力,重视发言的语气用词,少说官话套话大话,自说自话的官方话语体系。避免对事实情况了解不清,语焉不详而引发网友过度解读。如果失能及失职行为事实清晰证据确凿,应尽早表态,尽早认错。对于谣言更要尽早辟谣,尽早查处。
一件舆情热点事件最最长周期可持续一个月甚至几个月。这就要求对民众反馈进行再汇集,搜素平台包括微博、博客、论坛等,根据反馈再决定是否实行进一步的应对。政府发声前后说法要一致,不前后矛盾,自我否定,没有得出结论前只讲过程,最好给出各阶段的处置时间表。