时间:2022-08-25 12:22:49
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇个性化推荐系统,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
关键词:云计算;技术;个性化;系统
中图分类号: TP3 文献标识码: A 文章编号: 1673-1069(2016)32-166-2
0 引言
如今,互联网技术的深入发展,开始与各个领域实现有机融合,更多的人开始参与到在线购物、社交网络等网络活动中,网络给人们提供了一个无限的信息资源空间,这个资源库中包含了各式各样的信息,随之发展起来的信息检索技术便捷了人们对信息的搜索需求,搜索引擎成为用户获取信息的主要渠道,但该技术无法为用户提供个性化的兴趣服务,这就需要建立基于云计算的个性化推荐系统,这也是本文所要分析的主要内容。
1 云计算技术与个性化推荐系统概述
1.1 云计算技术
云计算技术依托的是互联网,将互联网的相关服务以动态化、易扩展、虚拟化的资源提供给用户。云计算的定义有很多种,目前较为认可的是云计算技术是根据用户使用量来进行相应交易的计算模式,云计算能够为用户提供便捷、按需的网络访问,进入网络、服务器、应用软件等可配置的计算资源共享区域,这些可以快速提供的资源,无须进行过多的管理,并与服务供应商交互不多[1]。云计算平台所拥有的超强计算能力,可以应用在模拟核爆炸、预测市场发展趋势及气候变化等活动中。
1.2 个性化推荐系统
推荐系统就是结合用户或顾客的购买行为规律以及兴趣特点来推荐相应的信息或商品,使用户满意。现如今,电子商务发展态势迅猛,商品的种类和数量与日俱增,网络信息是冗杂的,用户或顾客需要花费大量的时间找寻目标信息与商品,信息过载问题直接影响了用户或顾客的满意度,导致用户的流失。个性化推荐系统在此形势下应运而生,所谓个性化推荐系统是利用海量数据挖掘技术,通过云计算平台构建的一种高级商务智能平台,主要服务于网站,为用户提供完全个性化的决策支持和信息服务[2]。
2 基于云计算技术的个性化推荐系统分析
2.1 推荐算法与推荐策略
2.1.1 推荐算法
推荐系统利用各个网页间、网页与关键词之间的粗粒度关联和排序,实现为用户推荐相应信息与商品的服务。随着系统的不断发展,其也开始利用网络化计算能力,注重用户兴趣与模型的分析,而个性化推荐系统是在推荐系统的基础上建立的更高级的信息导向系统。个性化推荐系统的构建需要推荐算法的支持,常用的有协同过滤推荐算法、基于内容的推荐算法、关联规则推荐算法、混合推荐算法等。其中协同过滤推荐算法还可以细分,根据不同的算法特征分为基于用户的推荐算法(也叫作基于存储的算法、基于邻居的算法)、基于项目的推荐算法、基于模型的推荐算法等。这些推荐算法都具有自身的优缺点(详见表1),为了弥补各类推荐算法的缺陷,可以将两种互补的算法结合起来[3]。例如基于内容的算法和协同过滤算法这两种算法,我们可以为用户直接展示用不同算法得出的推荐结果集,也可以先用第一种算法得出一种结果集,再用第二种算法计算第一种结果集,进而得到更加精确的结果,更好地满足用户的需求。
2.1.2 推荐策略
以往许多的推荐系统都是结合单一的推荐算法和推荐策略建立的,在使用的过程中逐步暴露除了系统个性化与适应性方面的缺陷,无法结合实际的应用优化推荐策略。因此,在构建个性化推荐系统时要充分结合当下推荐系统的优势以及瞬息万变的市场需求,制定出综合化、系统化、合理化、可行性较高的推荐策略。
前文分析了各类推荐算法的优缺点及应用场景,基于此,本文提出的个性化推荐系统中应用的推荐策略是根据推荐系统数据量的大小制定的,当数据量偏小时系统会采用传统的个性化推荐算法;当数据量偏大时系统会利用云计算平台进行计算,具体就是将数据集发送到云平台的各个节点来实现多节点分布式大规模数据计算。
2.2 系统架构及流程设计
2.2.1 系统架构
云计算技术集成了分布式计算、网格计算、并行计算和网络存储等先进的技术,其有机整合了多个经济性较好的计算实体,逐步形成了具有超强计算能力的分布式系统。为了充分发挥出云计算技术的优势,本文设计的基于Google云计算平台的个性化推荐系统架构如图1所示,该系统能够对大规模数据进行快速、准确地处理,并且可以根据业务规模的不断扩大进行相应的拓展,充分展示了较高的通用性与扩展性[4]。
基于云计算技术的个性化推荐系统主要包括以下几部分:①推荐计算子系统,该子系统由数据预处理模块、数据挖掘模块、推荐模块组成,其中数据预处理模块的功能包括异构数据的过滤、统计、转换等;数据挖掘模块主要是计算推荐结果的聚类,需要充分利用聚类、关联规则算法进行分别计算;推荐模块则是利用各类算法计算出精准的推荐结果,已达到用户的需求。②业务应用子系统,该子系统主要是为后期的系统扩展服务,根据业务需求的变化转变系统的功能,并为系统需求制定合理的推荐规则。③基础云计算平台,其充分利用集群提供的大容量计算能力,在不同节点上进行大量的计算。
2.2.2 个性化推荐系统的操作流程
本系统的推荐流程是依据Map Reduce软件架构,其是处理海量数据的并行编程模式,主要适合应用于大规模数据集的并行运算,其封装了并行处理、容错处理、本地化计算、负载均衡等细节,还提供可以把大容量的计算自动并发和分布执行的简单通用接口。具体如图2所示[5]。
3 结束语
综上所述,开发设计基于云计算技术的个性化推荐系统是适应时展需求的,其能够更好地满足和引导用户信息需求。本文设计的系统还不完善,还需在以后的运行实践过程中不断的改进。
参 考 文 献
[1] 肖理钏.基于云计算模式的图书文献个性化推荐技术研究[J].科技广场,2015(08):22-27.
[2] 毅,刘亚军,陈诚.基于云计算技术的个性化推荐系统[J].计算机工程与应用,2015(13):111-117.
[3] 谷瑞.基于云计算的个性化推荐系统的研究[J].苏州市职业大学学报,2013(04):14-16+21.
关键词:个性化;采集;推荐
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2013)36-8222-03
基于社会计算的个性化推荐系统的设计,主要以新浪博客网页作为数据源来采集设计的,继而为其网页文档信息创建索引。主要模块包括网页文本信息采集,lucene索引库,搜索推荐主干,系统管理等。
为了实现网页文档信息的自动采集功能,本系统将采集模块设置了后台管理参数,来实现信息的自动“爬虫”功能,而为了使推荐模块能够基于用户的信息关键词来搜索并提高效率,就必须实现用户信息的即时搜索和反馈推荐功能。其详细设计如下:
1 系统流程分析
1)系统业务处理流程:首先,管理员利用爬虫进行数据的采集,并将采集到的数据(博客网页文档)存储进入本地数据库。采集完成即可对数据库中的文档建立索引。用户登录系统前台输入关键词进行搜索之后,服务器下达命令于搜索引擎,进行搜索并且对与关键字相关的数据进行协同过滤,最后推荐出用户感兴趣的信息,其处理流程如图1示,系统业务流程分析图。
2)系统数据处理流程:管理员登入系统后台爬虫参数设置界面,设置好采集数据参数,进而在数据采集页面进行抓取网页文档,在数据采集完成之对采集到的数据建立索引,其中包括博文的题目、作者、采集时间等。用户登录系统前台主页,输入搜索的数据,即关键词进行搜索,程序服务器往后台数据库发送命令,数据库返回协同过滤后的搜索结果给程序服务器,再完成所搜索到的博文以及其作者的反馈推荐。其处理流程如图2示,系统数据流程分析图。
2 系统概要设计
1)系统概念结构设计:概念结构设计就是根据需求分析的结果,以规定的方法将其转化为一个概念数据模型。而概念数据模型,是根据系统的需求点来对数据和信息进行建模,采用E-R关系图来描述。其系统总体E-R图,如图3示。
2)系统数据库设计:本系统选用Mysql数据库。从个性化推荐系统的功能需求点出发,在系统中设计了采集信息配置表(如图4示)、信息推荐表等数据库表(如图5示),可以准确有效地存储采集到的数据。
3)安全性设计:为了系统安全,采用身份和密码双重登陆验证机制,来确保系统后台管理只有管理员能够才能够登陆,进行爬虫参数设置、数据采集、索引建立以及采集信息查看等操作,保证了系统数据的安全性。
此外,还加设了数据库的安全工具策略,如对数据库中表字段或内容的编辑功能等操作,需要特定的数据库管理工具配合才能进行,从而进一步提高数据的安全性。
3 系统详细设计
1)系统功能结构设计:根据系统概要设计,将本系统分为前台交互和后台数据处理,由四个模块共同组成:爬虫采集网页文档和信息、lucene索引的创建,以及操控数据库、搜索主干、前台输入输出处理。各个模块分工协作运行。其系统功能结构如图6示。
本系统管理和界面设计,包含了前台和后台相联构建的内容,采用了Eclipse Tomcat服务器和JSP技术。以lucene创建索引,数据库应用了mysql,并使用JDBC来实现编程的友好交互,从而设计出友好的用户界面。此外,在整个系统的设计上,采用了 B/S 三层体系结构(如图7示)。管理员使用网页浏览工具向应用服务器发送服务请求,应用服务器接收请求,并且执行业务逻辑,将操作人员想要的信息返回浏览工具显示,确保整个系统使用过程的开放性与安全性。
本系统中抓取网页文档是系统的信息数据基础,也是数据的来源,只有有了丰富的数据源,才能够提供有效的服务。因此,本系统测试过程,主要以新浪博客网页作为数据源,来抓取其页面的文本, heritrix爬虫具有良好的扩充功能,可以通过编程进行过滤来抓取另外的文本。通过采集网页的信息,来对网页中有价值的数据实行提取,过滤掉那些无作用的数据,只留下有效性的文本信息,来提高存储的利用效率,其数据采集结果主要包括该博客网页文档以及该博客的地址,博客的题目、内容、作者以及采集的时间等,如图8数据采集过程图和图9数据采集查看图所示。而搜索推荐主干同样是利用lucene实现,搜索的关键字在已经创建的索引库中搜查对应的文本。
4 系统实现
基于社会计算的个性化推荐系统使用软件MyEclipse 8.5集成开发实现,采用JAVA语言来进行开发,页面采用jsp语言来设计实现,而数据库则是利用Mysql来实现,从而实现了根据用户的需求和兴趣为用户推荐出有价值的结果集,使用户能够在更短的时间获取到自己想要的信息,其结果转换如图10 系统推荐实现图所示。
参考文献:
[1] 陈诺言.基于个性化推荐引擎组合的推荐系统的设计与实现[D].广州:华南理工大学,2012.
[2] 梁弼,王光琼,邓小青.基于 Lucene 的全文检索系统模型的研究及应用[J]. 微型机与应用, 2011(3).
【关键词】电子商务 专家系统 电子商务个性化推荐技术
电子商务个性化推荐技术是指在电子商务网站在客户进行电子商务交易的过程中,根据用户的个性化完成对用户产品的推荐工作,通过对其网站系统内部超多的数据挖掘来有效的匹配到客户心目中的理想产品类型,为客户提供符合其个性化要求的产品购买信息以及相关服务功能。事实上,随着电子商务行业的不断进步以及发展,电子商务个性化推荐技术已经形成了专业成熟的电子商务个性化推荐系统,在电子商务网站的运营过程为客户的购买行为提供者非常重要和直观的技术支撑,保证客户个性化要求的满足。而在电子商务个性化推荐技术的组成结构中添加相应的专家系统模式,能够更加有效的分析出客户在电子商务购买行为中的购买需求、购买期望、购买目的,更好的帮助电子商务个性化推荐系统完成对不同客户的定位和识别,促进客户完成交易过程。
1 专家系统的主要内容
专家系统指的是一种专用的智能计算机程序系统,其内部含有大量的某一领域的专家水平的知识与经验,能够通过对这种经验的分析和应用有效的解决这一领域中出现的诸多问题。事实上,专家系统的组成结构与电子商务个性化推荐系统的组成结构是较为相似的,其二者都共同存在输入模块、数据收集以及分析处理模块和最终的输出模块等等,在电子商务个性化推荐系统中添加关于专家系统的智能程序,能够有效的提升电子商务个性化推荐系统中的智能型,使其能够更加充分的面对客户在电子商务交易行为中的种种决策并提供相应的信息帮助。
2 基于专家系统的电子商务个性化推荐系统的主要组成
正如上文所述,专家系统的强大之处在于其可以利用某一领域的专家知识,模拟专家决策时候的决策方式以及相应的推理和判断方式来解决某一领域中出现的诸多问题。在电子商务个性化推荐系统中应用专家系统这一程序,首先应该确定专家系统的主要领域以及相关的信息知识内容。具体来讲,电子商务个性化推荐系统中专家系统应该包含的领域和知识内容应该包括消费领域以及心理领域等等,其具体的知识内容应该包括电子商务客户的行为需求特征分析、电子商务客户的行为适宜行为需求特征分析、电子商务客户的决策行为需求特征分析等等,而专家系统在电子商务个性化推荐系统中的主要应用流程应该包括消费者描述自身的需求、专家系统分析适合消费者的需求、专家系统提取相应的产品信息满足消费者的需求以及专家系统在最后的过程中对于产品的优点介绍和竞争优势介绍等等,为消费者的最终决策提供信息帮助。
根据上述分析,基于专家系统的电子商务个性化推荐系统的主要结构应该包含专家系统的核心规则数据库(静态数据库)和电子商务网站的商品数据库以及客户数据库(动态数据库),同时使用咨询子系统、规则子系统以及结果子系统来实现专家系统核心规则数据库以及电子商务网站动态数据库之间的有效衔接和运用。
2.1 专家系统核心规则数据库
逻辑上个性化推荐系统的静态数据库可以使用专家系统的核心规则数据库作为程序建立的核心内容,用来存放专家系统运行的领域知识结构以及内容,并设置相应的辅助参数保证专家系统核心规则数据库的良好运行。
2.1.1 规则特性
每一个规则包括四个特性,例如PREMISE规则的前提部分、ACTION规则的操作部分等等,同时注意CATEGORY规则按照上下文分类,每条规则只能用于某几个上下文,以便调用;
2.1.2 设置参数
每个设置参数应该各自存储一组属性,用来咨询以及程序调用,同时规定好每一个参数的参数组名称、参数取值范围、参数的类型结构。
2.2 动态数据库
电子商务网站的用户数据库以及产品数据库都隶属于动态数据库的存储范围,每一次客户登录或者登出的过程中,电子商务网站的动态数据库都会随之实时更新一次,添加相应的动态数据内容。动态数据库对数据的主要存储方式是根据相关对象、相关对象的具体属性以及相关对象的具体参数数值(对象可信度、对象参数、对象跟踪次数)来确定对该对象的信息存储、追踪和使用过程。
2.2.1 电子商务用户数据库
电子商务用户数据库的存储信息主要是商务网站浏览和登录登出过程中各个用户的主要信息,包括用户的性别、年龄、职位、爱好、收藏、收入、购物经历以及其他相关信息等等。
2.2.2 电子商务商品数据库
电子商务商品数据库的存储信息主要是诸多网站商户的产品细细,包括产品的名称、品牌、价格、尺寸、重量、功能、材料、生产日期、保质期、售后服务以及其他相关的产品信息等等。
2.3 资讯子系统
资讯子系统的主要功能是根据客户在电子商务网站上的登录、访问、收藏、购物等一系列信息对网站的客户数据库提供对客户的定位信息,更好的做好客户个性化产品的推荐工作,同时有效的满足客户产品咨询的功能。
2.4 规则子系统
规则子系统的主要功能是专家系统的核心规则内容,专家智能系统能够凭借自身的核心规则以及规则子系统的有效连接来实现客户的产品推荐工作。
2.5 结果子系统
结果子系统的主要功能是记录客户浏览、咨询以及最终购买的过程,为客户的可信度数值提供相应的资讯信息,并记录下客户本次的操作内容,为客户的下次购买提供信息支持。
3 结语
综上所述,本文对基于专家系统的电子商务个性化推荐系统的主要组成结构以及相关功能进行了分析,电子商务网站在应用专家系统的过程中仍然需要注意对专家系统智能模块以及网站个性化推荐模块两者之间的有效连接和应用,使专家系统能够有效的融入在电子商务个性化推荐系统中并发挥功用。
参考文献
[1]马丽.电子商务个性化推荐技术分析及比较[J].计算机系统应用.
关键词:个性化服务 Web使用挖掘 频繁访问模式 在线推荐
中图分类号:TP311.52 文献标识码:A 文章编号:1007-9416(2012)07-0141-02
1、引言
互联网已经成为日常生活不可或缺的重要组成部分,然而随着近年来爆炸式地增长,信息过载与信息迷失正逐渐制约着人们利用互联网来高效地获取有价值的信息。面对浩如烟海的网络空间,如何快速定位到个人真正感兴趣的资源是一个迫切需要解决的问题,个性化服务应运而生。本文采用当前网络开发的较为成熟的主流技术,设计了一个基于Web使用数据挖掘的个性化推荐系统。
2、个性化服务的概述
2.1 个性化服务的主要方式
个性化服务是以用户为中心的,解决和满足用户的信息服务的需要。目前,个性化服务方式主要有以下几种:
(1)信息分类定制服务:主要面对大众提供可以定制的 web 页面,具有为用户创立和管理个人信息的功能,用户可根据自己的需要定制个性化的界面设置、信息资源和服务形式,而系统会根据用户的定制要求完成个性化的页面设计,自动呈现用户需要的信息类别。
(2)个性化信息检索服务:根据用户的兴趣和特点进行检索,返回与用户需求相关的检索结果。这就要求个性化信息系统增加优化查询功能,通过内容过滤等技术,在检索的同时考虑用户的个性化差异,从而提高检索质量。
(3)个性化推荐服务:主要是根据用户的信息例如用户的喜好,为满足用户的信息需求向用户推送用户喜好相关的信息,在这个过程中就是根据用户的需求和目前的信息数据库进行不断的配对,将相关的信息推送给用户。
2.2 个性化服务的相关技术
(1)数据挖掘是从大量的、不完整的、有噪声的、模糊的和随机的数据中,提取隐含在其中的、人们事先不知道的、但又是可信的、潜在的和有价值的信息和知识的过程。
(2)信息推送技术是通过一定的标准和协议,在网络上按照用户的需求,定期主动传送用户需要的信息的一项计算机技术。推送技术的核心思想是建立一个信息机制,把由客户端担负的责任转给服务器,由服务器将用户定制好的感兴趣的网上信息以推送或网播的方式直接传送到用户面前。
(3)信息过滤是指从动态的信息流中获取符合用户静态需求的信息,或者根据需要禁止满足特定条件的信息流入。
(4)Web挖掘技术它可以从网络浏览行为中抽取用户感兴趣的模式。通过对用户浏览网站的日志数据进行收集、分析和处理,建立起用户的行为和兴趣模型,这些模型可以帮助理解用户行为,改进站点结构以及为用户提供良好的个性化信息服务。
3、系统分析和设计
3.1 个性化服务的内涵及特征
个性化信息服务是“信息爆炸”的背景下针对“信息过载”和“信息迷向”问题的重要解决方案之一。它基于用户的学科、兴趣和使用习惯等特征,利用网络等信息技术,通过用户个人信息定制、系统推荐和信息推送等功能,针对不同的用户需求,采用不同的服务方式,提供不同的信息内容,实现多层面的个性化。从理论层面讲,个性化信息服务是一种服务理念,从技术层面讲,个性化信息服务是一个实现个性化服务的平台。具休地说,个性化信息服务具有如下特征:
3.1.1 以用户需求为中心
以用户需求为中心包含两层含义:一是以用户的需求为导向设计与安排服务功能与设施;二是创建个性化的信息环境,按照用户或用户群的特点组织信息资源,提供多样化的信息服务。
3.1.2 信息资源多元化
通过对各种馆藏资源的有效组织、管理与配置,建立多元化的信息资源组织体系,为读者利用馆藏资源提供最大的便利。支持个性化服务系统的数据库包含指向丰富信息内容的链接,力争达到让用户即需即得的效果。
3.1.3 具有智能化分析和挖掘用户需求的功能
智能化分析是指主动采集并跟踪用户浏览的信息,一方面从用户日常检索浏览中主动学习用户的兴趣,推理并预测用户需求,及时处理推荐信息;另一方面可根据不同用户的相同点或相似性进行信息推荐,使需求相同的用户之间共享查询结果。
3.1.4 推荐信息的准确性、高效性
由个性化服务推荐给用户的信息必须是准确的、高效的、适合用户的。能通过使用信息过滤等技术,屏蔽无关、无用的冗余信息,推荐精确、真实可用的信息;能自动地、智能地将大量的数据信息转换为用户所要求的或用户可接受的系统知识形式,从而节约用户时间,提高服务效率。
3.2 系统结构设计
在Web使用挖掘的一般过程中,主要将其划分为三个阶段:数据预处理;模式发现;模式分析与应用,如图1所示。
由于服务器日志并非专门用于数据挖掘,因此在进行Web使用挖掘之前必须对其进行处理过滤,解决数据的不一致性、不完整性等问题,使之符合Web挖掘的需要,这就是数据预处理阶段,预处理的结果会直接影响到挖掘算法产生的规则和模式;模式发现阶段即挖掘算法实施阶段,是对预处理后的数据使用数据挖掘中的算法如关联规则,聚类分析等来产生规则和模式;模式分析与应用阶段是整个Web使用挖掘过程的最后一步,此阶段的主要目的是通过一定的技术和方法过滤掉模式发现阶段产生的“不感兴趣”的规则和模式。
3.3 系统功能模块设计
整个系统框架包括离线和在线推荐引擎两部分。离线部分又包括数据准备、用户兴趣建模等模块;在线部分则由建立推荐池、产生初步推荐集、融合离线部分产生结果推荐集模块组成。离线部分承担数据准备和知识挖掘等功能,该部分面向的数据源通常为系统内存储的各种海量历史数据,挖掘处理需要较长时间,因此被设计为离线部分,以避免对实时性要求的影响;在线部分则承担向当前用户提供实时个性化服务推荐等功能,该部分是建立在离线部分的基础上,直接参照其所生成的基于用户兴趣的页面推荐集,针对不同用户快速生成各种推荐服务。基于Web挖掘的个性化推荐系统的功能框架图如图2所示。
图2 基于Web挖掘的个性化推荐系统框架图
各子模块功能如下:
(1)数据准备模块。该模块是对原始的用户访问日志进行数据采集、数据清洗和事务标识,生成对挖掘阶段有用的用户会话文件、事务数据库及将站点的相关文件生成站点数据文件。
(2)建立用户兴趣模型库模块。该模块使用Web挖掘技术对用户访问页面内容和用户访问行为进行分析,抽取用户兴趣,结合信息资源的相关性,形成用户兴趣的矢量描述,并能随着用户的访问的推进和用户兴趣的改变,及时更新用户模型。
(3)建立推荐池模块。该模块就是通过获取用户评价,得到带有用户访问时长的用户访问页面集合。
(4)产生初步推荐集模块。该模块通过对当前用户访问页面的相似度计算,继而进行用户聚类分析,再对聚类用户进行关联规则发现,产生初步推荐页面集。
(5)融合离线部分产生个性化推荐集模块。该模块将产生的初步推荐页面集与离线部分的用户兴趣模型相匹配。通过比较产生出最适合用户的个性化推荐页面集,并把这些页面的地址附加到当前访问页面的底部,以进行推荐(图3)。
4、结语
综上所述,本文在对web服务技术及数据挖掘语言实施了分析和研究后,提出一个基于Web使用挖掘的个性化系统架构,该系统通过挖掘用户Web访问信息,生成了独立的用户兴趣模型库,可以更全面地反映用户的兴趣偏好,从而为用户提供更详细的信息推荐。
参考文献
[1]韩家炜,孟小峰.Web挖掘研究.计算机研究与发展,38(4):405-414,2001.
[2]崔林,宋瀚涛,龚永罡,陆玉昌.基于Web使用挖掘的个性化服务技术研究.计算机系统应用,第三期:23-26,2005.
[3]王彤,何丕谦.Web日志挖掘及AprioriAll算法的改进.天津理工大学学报,23(1):13-17,2007.
本文参考社会学和心理学将人们之间信任的产生来源分为三个方面:外部来源、交互来源和内部信任,如图 1.1所示。外部信任是由于当前用户在公共环境中的声誉而使得其他用户对其产生的信任,它是一种全局信任,独立于单个用户。交互信任是系统中用户之间的交互所产生的信任关系,这是一种本地信任度。内部信任,是由于两个人之间内在的相似性(如爱好等)产生的信任关系。
图 1.1 分层信任模型示意图
1 基于层次的信任度计算模型
本文提出基于层次的信任度计算模型如(1.1)所,其中Reputation表示外部信任,InteractiveTrust表示交互信任,Similarity表示内部信任。a,b,c是加权平均系数,满足a+b+c=1。这三个系数分别应对不同类型的用户:冷启动用户、常规用户,争议用户。
(1.1)
在本文接下来的篇幅中将详细介绍三种信任的计算方法以及a,b,c三个参数对于不同用户的取值情况。
1.1 外部信任
本文使用的PageRank算法来计算外部信任。PageRank将指向一个网页的链接看成是对于这个网页的投票,本文将这种链接称之为回指链接,而将一个网页指向其他网页的链接称之为外向链接。例如在图 2.1中,将用户看作是网络中的结点,将用户之间的信任关系看做他们之间的信任,对于用户A来说,从其他用户到用户A的链接如(B->A)等都是用户A的回指链接;而从用户A到其他用户的链接如(A->B)等都是用户A的外向链接。
图 2.1 信任网络初始状态示意图
PageRank在计算网页排名的时候不单单考虑了网页的回指链接的数量,更重要的是它还考虑了回指链接源网页的价值。也就是说,一个高等级的页面可以让它所指向的低等级的页面的等级提升。PageRank中,一个页面的重要性是由链向它的所有页面的重要性经过递归算法得到的,如等式(2.2)所示是RageRank的数学表达式:
(2.2)
Reputation(u)表示用户u的信誉度,Bu表示指向用户u的所有用户的集合,Nv表示以用户v为源用户的所有链接的数目,也就是用户v的外向链接数。
1.2 交互信任
本文使用MoleTrust来作为度量交互信任值的算法,之所以选择MoleTrust有两个原因:1. 它具有省时高效的特点;2. 该算法对信任的计算是按照层次顺序进行的,这与我们的社交习惯非常类似。接下来将详细介绍MoleTrust的计算过程及其缺点以及对MoleTrust的改进措施。
1.2.1 MoleTrust
MoleTrust的整个计算过程可以分为两步完成:1.从源节点出发遍历整个信任网络,去除网络中多余的信息和循环信任,构造一个单向无循环的信任网络;2.在第一步的基础上,从源节点出发开始传播信任值,计算当前用户对于网络中其他用户的信任。如Step 1和Step 2所示,是MoleTrust的具体运算过程:
MoleTrust的Step 1过程有一个非常重要的参数:trust_propagation_distance,该参数用来控制信任传播的距离。图 2.1经过MoleTrust的Step 1阶段后得到图 2.2所示信任网络。将该信任网络视为一个有向图,在图的第0层是当前用户A,第1层,为用户A的直接朋友,以此类推。
图 2.2 经MoleTrust的Step 1后的信任网络
在MoleTrust的Step 2阶段,同样有一个非常重要的参数:trust_threshold。只有信任值大于trust_threshod的用户才会被加入到信任网络中,该策略可以有效防止恶意用户对于推荐系统的影响。
1.2.2 Modified MoleTrust
MoleTrust在计算信任值的过程中存在一个很大的漏洞,如Tr(A,G)=7,但这和我们的直觉是相悖的,因为G的上层用户C的信任值只有3。为了弥补上述漏洞,本文提出一种修正的MoleTrust:Modified-MoleTrust。本文在在MoleTrust的Step 2阶段引入一个递减因子ω,其计算方式如等式(2.5)所示。
1.3 内部信任
本文认为用户对项目的评分是用户内部属性的综合体现,所以本文选择用户对项目的评分矩阵来作为内部信任的计算依据。有学者证明了在众多衡量用户相似性的指标中,Person相关系数的综合表现最好,所以本文选择Person相关系数作为内部信任的衡量指标。
Person相关系数的取值范围是[-1,1],若Person相关系数的取值为正,则说明两个用户之间存在着相似性,反之当其取为负时说明两个人之间的兴趣可能是相悖的。Person相关系数的计算公式如等式(2.6)所示。其中n表示用户A和用户W共同评分的项目数,r(K,i)表示用户K对项目i的评分。
2 实验结果说明
本文利用Epinions网站的数据和Apache的Mahout平台对所提出的模型进行了验证。面对不同类型的用户,对参数进行调整后,该模型总能得到较为理想的推荐准确度和覆盖率,具体数3 结束语
摘要:随着移动技术的发展,社交网络已经成为互联网产品中的主体,而社交网络产生的大量关系数据可以被用来进行个性化推荐的研
>> 基于网络数据挖掘的个性化电子商务推荐系统研究 基于大数据的社团个性化推荐系统 基于swarm平台和社交网络的电子商务个性化推荐系统仿真模型的理论构建 网络数据挖掘在图书馆个性化推荐中的应用研究 基于个性化推荐的网络营销 基于数据挖掘的电子政务个性化推荐服务框架研究 基于数据挖掘的个性化智能推荐系统应用研究 基于社交网络的个性化知识服务模型研究 基于免疫进化的网络教学资源个性化推荐系统研究 移动社会网络中基于位置的个性化餐馆推荐建模研究 基于IPTV的个性化推荐技术的研究 个性化好友推荐系统在社交网站上的应用研究 基于社交网络的社会化推荐算法研究 基于个性化混合推荐算法的网络推荐系统 基于数据挖掘的个性化推荐在SNS中的应用 基于Web使用数据挖掘的个性化推荐系统设计 基于小数据的高校图书馆个性化推荐 基于个性化推荐学习的网络培训教学课程平台的设计与实现 基于网络学习行为的个性化评价研究 社会化标签系统中基于本体的个性化推荐方法研究 常见问题解答 当前所在位置:l
[2]张婷婷. 社会化网络中人际关系与人际传播研究[D].长沙:湖南大学,硕士学位论文,2012
[3]王萍. 社会化网络的信息扩散研究[J]. 情报杂志,2009,28(10):39-42
[4]《2013-2017年中国社交网络行业发展前景预测与投资机会分析报告》:前瞻产业研究院,2013
[5]项亮. 推荐系统实践[M].北京:人民邮电出版社,2012
[关键词] 电子商务个性化信息服务个性化推荐系统
一、个性化信息服务
随着网络技术的不断发展和电子商务的盛行,个性化信息服务成为了各商家在激烈的竞争中立于不败之地的重要法宝。DELL公司的成功,就证实了个性化信息服务的重要性。个性化信息服务是指互联网络使用者可以按照自己的目的和需求,在某种特定的网络功能和服务方式中,自己设定网上信息的来源方式、表现形式、特定网上功能以及其他的网上服务方式等,以达到最为快捷地获取自己所需的网上信息服务内容的目的,强调“以用户为中心”尽可能的满足用户的需求。个性化信息服务应用于电子商务中,通过捕获用户的兴趣来提高商品的销售量。
二、个性化信息服务的主要特点
1.以用户为中心,以满足用户个性化的价值追求为目标。个性化信息服务应主动为用户选择最需要的资源与服务,根据用户需求的变化,动态的改变所提供的信息,让用户得到个性化的服务。它以满足特定用户的特定需求为主旨,以给用户提供最快捷、最方便、最易用的服务为目标,它是“以用户为中心”的服务,可以是以用户的信息需求为依据,面向用户开展的一切服务性活动,也可以是针对特定需求向用户提供特定信息的有计划、有目的的活动,服务的基础就是用户的信息需求。
2.具备智能化信息分析与处理功能。个性化信息服务中的智能化信息分析与处理功能一方面表现在系统的主动性推荐和协同推荐上,另一方面表现在对用户综合行为的挖掘中。主动推荐是指主动采集并跟踪用户浏览的信息,从用户日常检索浏览中主动学习用户的兴趣,推理并预测用户需求,及时处理推荐信息;协同推荐是指根据不同用户的相同点或相似性进行信息推荐,使需求相同的用户之间共享查询结果。用户综合行为的挖掘是针对用户所有可能被记录下来的行为进行数据挖掘,实现资源的深层挖掘并提供有效的服务。
3.推荐精确、系统的知识。个性化信息服务通过过滤、屏蔽无关无用的冗余信息,推荐精确、有效、真正具有针对性的信息,:能自动地、智能地将大量的数据转换为具有规律性、系统性的知识,形成具有内在关联的信息链和知识链,并以易于理解的模式推荐给用户。
4.主动性、高效性、灵活性。个性化信息服务采用“push”技术,其主动性主要是指服务不需要用户及时请求而主动地将数据传给用户,与传统的浏览器的“pull”技术的被动服务形成鲜明的对比;高效性主要是指可在网络空闲时启动,能够有效的利用网络带宽,比较适合传送大量的多媒体信息;灵活性主要体现在用户能够完全根据自己的方便和需要,灵活地设置连接时间,通过E-mail、对话框、音频、视频等方式获取网上特定信息资源。
5.允许用户充分表达个性化需求。个性化信息服务系统不仅提供友好的界面,而且方便用户交互、描述自己的需求、反馈对服务结果的评价等。
三、个性化信息服务研究的基本问题
个性化信息服务研究的基本问题包括个性化的具体应用:个性化应用分为资源的个性化入口和过滤/排序;用户信息需求定义文件的表示与创建:用户信息需求或兴趣的描述和存储;协同过滤与单独过滤:针对一个或一组用户对信息文档根据文件进行的相关度排序;系统的体系结构:用户信息需求定义文件放在服务器还是客户计算机上,或者处于二者之间的服务器上;个性化系统的评估:包括信息需求定义文件的收敛分析和信息需求定义文件是否反映用户的实际兴趣分析。这些问题也是设计一个具体的应用必须要明确的问题,而且它们之间是互相关联、互相制约的。
四、个性化信息推荐系统
推荐系统是一种在特定类型数据库中进行知识发现的应用技术,使用多种数据分析技术为用户更好的服务,向用户主动、及时、准确地提供所需信息,并能根据用户对推荐内容的反馈进一步改进推荐结果。不仅要对用户提出的要求提供最贴切的信息服务,还要能依据个体个性特征,主动收集个体可能感兴趣的信息,甚至预测个体可能的个性发展,提前收集相应的信息,最后以个性化方式显示给个体。是实现个性化信息服务的关键。
1.个性化信息推荐系统的关键技术。个性化信息服务推荐系统是实现个性化信息服务的主要途径,主要是通过信息过滤和协同过滤等技术将用户需要的信息推荐给用户的。其关键技术有:
(1)内容过滤技术:试图跟踪和把握用户的潜在信息需求,比较资源和用户描述文件,对动态信息流进行过滤,尽量屏蔽无用信息,向用户主动提供信息资源列表,从而提高用户获取信息的效率。
(2)协同过滤技术:利用用户的访问信息,通过用户群的相似性进行内容推荐,不依赖于内容仅依赖于用户之间的相互推荐,避免了内容过滤的不足,保证信息推荐的质量。
(3)聚类分析技术:对数据对象进行分类,把一组数据对象分到不同簇中,簇是一组数据对象的集合,使簇内各对象间具有较高的相似度,而不同组的对象差别较大。
2.个性化信息推荐系统的基本要求。个性化信息服务是为用户打造量身订制的服务,是为了更好的满足用户的需求。个性化信息服务推荐系统应该满足个性化、主动性、新颖性、准确性的基本要求。
(1)个性化:根据不同用户的不同背景、不同需求,为不同用户提供不同的信息,存在一定程度的个性差异。
(2)主动性:系统主动根据用户的信息需求向用户提供信息,实现“信息找人”的过程,而不是“人找信息”。
(3)新颖性:系统向用户提供的信息是用户以往所不具有的,未曾访问的却又是需要的。
(4)准确性:在相同或相近的信息资源中,对两个不同用户的相似要求返回不同的信息结果,以满足不同用户的不同需求。
3.个性化信息推荐系统体系结构。目前,个性化信息推荐系统总的来说可以分为基于规则的和基于过滤的两种推荐系统。基于关联规则的个性化信息服务,主要针对特定的站点组织结构,采用最大向前访问路径辅助内容事务方法。制定一系列规则并利用这些规则为特定用户提供服务。利用规则来推荐信息依赖于规则的质量和数量,基于规则的技术缺点是随着规则的数量增多,系统将变得越来难以管理。基于过滤的个性化推荐服务分为基于内容过滤的推荐服务和基于协同过滤的推荐服务。基于内容过滤是通过比较资源和用户信息描述文件,推荐与用户兴趣相似的资源。基于协同过滤的推荐系统则是利用用户群的访问信息,通过用户群之间的相似性进行内容推荐。
结合以上两类系统,为了能够为用户主动提供所需信息,个性化信息服务推荐系统一般需要通过用户接口模块、需求信息模块、信息检索模块、用户分析模块、信息过滤模块、信息推送模块6个功能模块来实现。
(1)用户接口模块:是用户与系统之间的接口。负责处理用户初次输入的用户信息,并将它存储在用户信息库中;接收用户输入的认证信息,与用户信息库中的个人认证信息比较,完成用户身份认证;处理用户的检索需求;将用户输入的兴趣、爱好信息及用户对于推荐信息的评价提交给需求分析模块,接收信息推送模块送来的信息,最终将其提交给用户。
(2)需求分析模块:是对用户接口模块送来的用户初始兴趣信息进行分析,建立用户模型,并根据用户反馈修改用户模型。
(3)信息检索模块:是接收用户接口模块处理过的用户检索需求,检索本地数据库和网络数据库,并将检索结果送到信息过滤模块,并将其存储到本地信息库中。
(4)用户分析模块:是负责比较该用户模型与其它用户模型之间的相似度,找出有相同或相似兴趣的其他用户,相互推荐信息,实现信息资源共享。
(5)信息过滤模块:是根据用户模型对信息检索模块返回的检索结果进行过滤并将过滤的结果送到信息推荐模块;此外,如果用户分析模块找到了具有相同或相似兴趣的用户,信息过滤模块也将这些用户的个性化信息传送到信息推荐模块。
(6)信息推荐模块:是负责实现主动信息服务,根据用户信息库中对于信息推送的时间、数量等设置,将经过信息过滤模块过滤的信息推送到用户接口模块。
五、结束语
传统的定题服务所具有的主动性是有限的,从根本上讲仍是“用户找信息”,而个性化信息服务是依托网络环境的,可以在较高程度上改变信息与用户的关系,能够满足网络环境下真正实现“信息找用户”。个性化信息服务以其交互性好、不受时间地域的限制、针对性强、资源丰富等优点,将成为电子商务发展的方向。
参考文献:
[1]曾春:信息过滤的概念表示与算法研究[D].北京:清华大学,2003
[2]刘伟成焦玉英:网络信息过滤的方法与相关技术研究[J].现代图书情报技术,2002(4):48~50
电子商务推荐系统(RecommendationSystemsforE-Commerce)定义是:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。
推荐系统面对的是用户(user),任务是为用户提供对项目(item)的推荐。用户是指推荐系统的使用者,也就是电子商务活动中的客户。项目是被推荐的对象,是指电子商务活动中提供给客户选择的产品和服务,也就是最终推荐系统返回给用户的推荐内容。在一个电子商务活动中,用户数和项目数是非常多的。推荐系统面对的当前用户,称为目标用户或者活动用户。推荐系统的当前工作,就是为根据一定的算法,给出对目标用户的推荐项目。
电子商务推荐系统主要由三大部分构成:输入模块、推荐方法模块和输出模块。输入模块用来接受用户的输入信息,用户的输入信息中最重要的是用户对项目的评价(rating)数据;推荐方法模块用来根据一定算法,根据用户数据,得出对目标用户的推荐,该模块是整个推荐系统的核心部分,个性化推荐方面的研究的很大一部分,都集中在找到好的推荐方法。输出模块主要是指得到的推荐以何种形式反馈给用户。
根据项目的特点,目前主要有两种类型的推荐系统,一种是以网页为对象的个性化推荐系统,主要采用Web数据挖掘的方法与技术,为用户推荐符合其兴趣爱好的网页;另一种是网上购物环境下的、以商品为推荐对象的个性化推荐系统,为用户推荐符合其兴趣爱好的各类产品,如各种书籍,音像等,这种推荐系统也称电子商务个性化推荐系统。
二、电子商务个性化推荐系统的作用
电子商务推荐系统的最大的优点在于它能收集用户兴趣资料并根据用户兴趣偏好为用户主动作出个性化的推荐,也就是说,当用户每次输入用户名和密码登录电子商务网站后,推荐系统就会按照目标用户偏好程度的高低推荐用户最喜爱的N个产品,而且系统给出的推荐是实时更新的,也就是说当系统中的产品库和用户兴趣资料发生改变时,给出的推荐序列会自动改变,大大方便了用户,也提高了企业的服务水平。
总体说来,电子商务推荐系统的作用主要表现在以下几个方面:一方面,使用户从无限的网络资源和商品世界中解脱出来,大大节约了用户采购商品的时间和成本;与此同时,推荐系统的个性化推荐服务,提高了客户对电子商务网站的忠诚度(BuildingLoyalty),将更多的电子商务网站浏览者转变为商品的购买者,从而提高电子商务网站的交叉销售能力(Cross-Selling),为电子商务企业赢得了更多的发展机会。
研究表明,在基于电子商务的销售行业使用个性化推荐系统后,能提高销售额2%-8%,尤其在书籍、电影、CD音像、日用百货等产品相对较为低廉且商品种类繁多的行业,以及用户使用个性化推荐系统的程度高的行业,推荐系统能大大提高企业的销售额。
电子商务推荐系统和销售系统(MarketingSystems)、供应链决策支持系统(Supply-ChainDecision-SupportSystems)既相似又有不同。销售系统是帮助销售人员如何把产品销售出去;推荐系统最终目的帮助用户,辅助用户购买什么产品做出决策。供应链决策支持系统是帮助生产者决定什么时候生产多少什么产品,以及仓库应该存贮多少各类产品,其最终目的是为企业生产者服务的,而同样推荐系统是面向用户的系统。
三、电子商务个性化推荐系统的研究内容
电子商务个性化推荐的研究有四方面的问题:首先,要解决推荐系统的信息来源问题——推荐系统的基础是用户兴趣资料信息,如何在电子商务环境下尽可能获得更多用户的相关信息,并以合适的形式表示是进行个性化推荐的前提;其次,要实现被顾客接受和认可的个性化推荐,设计准确、高效率的个性化推荐算法是核心;另外,要让推荐系统为广大用户所接受,必须对推荐系统作出客观、综合的评价,尤其要注意从准确率、个性化、安全性、用户满意度等多方面进行评价;推荐系统的应用是最终研究的落脚点,推荐系统不仅能为用户提供完全个性化购物环境,更应为企业的销售决策和客户关系管理提供支持。
在电子商务环境下,用户信息收集表示是电子商务个性化推荐的基础。根据当前对电子商务环境下用户信息收集表示的研究来看,主要着眼于研究如何有效地收集能反映用户兴趣偏好的信息,以及如何通过网络数据挖掘等的方法更自动化地收集用户的隐式信息,解决用户信息收集过多的依赖于显式评价数据的问题。
个性化推荐技术是电子商务自动化推荐系统的核心问题。目前的推荐技术有协同过滤推荐(包括基于用户的和基于项目的)、基于用户人口统计信息的推荐、基于内容的推荐、基于效用的推荐、基于知识的推荐、基于规则的推荐等等。协同过滤推荐是个性化推荐中研究和应用最多的方法,广泛应用于电子商务网站、数字图书馆、网页搜索、新闻过滤等,著名的推荐系统有Tapestry、GroupLens/NetPerceptions、Ringo/Firefly等,其前提假设是存在具有相似兴趣爱好的用户群,每个用户都有与其兴趣爱好相似的邻居用户。预测用户对某一项目的偏好是根据邻居用户对该项目的偏好程度计算的,也就是说如果其邻居用户喜爱某项目,则该用户也很可能会喜爱该项目。协同过滤最大优点是不需要分析对象的特征属性,所以对推荐对象没有特殊的要求,能处理非结构化的复杂对象,如音乐、电影等。
对推荐系统总体性能的评价是推荐系统研究的重要组成部分。目前大都只是采用准确率、召回率等评判尺度对推荐算法进行评价,并没有真正意义上的、提升到对整个推荐系统进行的评价,尤其缺乏从个性化程度、持久性程度、系统的安全性以及用户接受程度等多方面对推荐系统进行综合的评价。
四、研究现状
推荐行为产品或其它项目的软件已经在许多应用中使用在电子商务领域,为了增加购买经验并满足客户需求,已经推出了充分利用消费者的访问和购买行为的推荐系统。推荐者通常通过给用户展示他们可能感兴趣的产品或服务来促进购买。例如,诸如就是通过利用偏好或其他用户购买信息来介绍书籍或者其它产品给用户的推荐系统。然而,使用的技术相当简单,而且并非很精确和有效。基本上,程序将当前客户购买的一系列产品与其他客户购买的一系列产品作比较,选择客户购买较多的产品与当前客户购买的产品集合的交集,最后从中选出一些尚未被客户所购买而仍然在顾客购物篮中的产品,并将它们作为推荐列表呈现给客户。该技术也用于类似于协作过滤的文本文档的信息抽取。电影或音乐唱片的推荐,例如,通过预知一个人的偏好与其他人偏好的线性权重集合,并运用协作过滤技术来实现。
对于推荐系统的研究可分为三个种类:技术系统开发研究,用户行为研究和隐私问题研究。其中技术系统开发是重点。目前各种推荐技术,例如数据挖掘,和推理,都已经应用到了推荐系统中。现存的推荐系统从广义上可以划分为基于规则的系统和信息过滤系统。信息过滤系统又可分为基于内容过滤的系统和协作过滤系统两种。
基于规则的系统,N1如:IBM的WebSphere,BroadVi-sion,ILOG等。他们允许系统管理员根据用户的静态特征和和动态属性来制定规则,一个规则本质上是一个if-then语句,规则决定了在不同的情况下提供不同的服务。基于规则的系统,其优点是简单、直接,缺点是规则质量很难保证,而且不能动态更新。此外,随着规则的数量增多,系统将变得越来越难以管理。
基于内容过滤的系统,例如:PersonalWebWather,SysKill&Webert,Letizia,CiteSeer,ifWeb,SIFTER,PVA,WebMate,WebACE,ELFI和WebPersonalizer等。他们利用资源与用户兴趣的相似性来过滤信息。基于内容的推荐系统通过将顾客的偏好与产品内容自动匹配来给顾客提供建议,例如网页和消息条目的推荐。在基于内容的系统中,产品由其普通属性描述。顾客偏好通过分析产品比率以及相应的产品属性来预测。基于内容过滤的系统,其优点是简单、有效。缺点是难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源。在基于内容的推荐系统中,一个核心问题是识别关键属性集合。如果该集合太小,显然,这对于识别用户剖面是不充分的。因此,基于内容的推荐系统不能用于仅仅实施一次购买行为新顾客,或者访问了该网站,却没有实施任何购买行为的潜在顾客,以及购买他不是特别经常购买的一种产品的顾客。
协作过滤系统如:WebWather,Let'sBrowse,Tapestry,GroupLens,Fab,Alexa,Firefly,SELECT,LikeMinds和Site-Seer等。他们利用用户之间的相似性来过滤信息。协作性的推荐系统估计顾客对特定产品的偏好是根据顾客对该产品的偏好率以及其他顾客对同一产品的偏好率的比较来实现的。协作性的推荐系统与基于内容的推荐系统之间的主要区别是协作性的推荐系统通过跟踪一组顾客过去的行为来给该组中的个别顾客提供建议。使用该方法,顾客现在就可以接受建议,而在基于内容的推荐系统中,只要具有相似意向的其他顾客的偏好,顾客就己经具有先前预测了。基于协作过滤系统的优点是能为用Web数据挖掘的研究及其在网络学习个性化推荐中的应用户发现的新的感兴趣的信息,缺点是存在两个很难解决的问题,一个是稀疏性,亦即在系统使用初期,由于系统资源还未获得足够多的评价,系统很难利用这些评价来发现相似的用户;另一个是可扩展性,亦即随着系统用户和资源的增多,系统的性能会越来越低。协作性的过滤方法用来识别与既定客户具有相似兴趣的顾客,所推荐的产品也是这些给定客户喜欢的产品。该方法的一个主要局限是稀疏问题。在基于协作过滤的推荐系统中,很难精确确定下相似客户和识别要推荐的产品。不仅如此,系数问题的极端形式是first-rater问题,当市场引入一种新产品时,不存在可用的先前估计信息。
还有一些个性化服务系统如:WebSIFT,FAB,Anatagon-omy和DynamicProfiler等,同时采用了基于内容过滤和协作过滤这两种技术。结合这两种过滤技术可以克服各自的一些缺点,为了克服协作过滤的稀疏性问题,可以利用用户浏览过的资源内容预期用户对其他资源的评价,这样可以增加资源评价的密度,利用这些评价再进行协作过滤,从而提高协作过滤的性能。
近来,许多因特网公司还引进了有关信息产品的推荐系统,它包括Web站点推荐,音乐推荐,视频推荐,书籍推荐等等(例如,以及等等)。因特网行销机构运用推荐系统对某一广告公司推荐用户(例如Ac-tiveAgentWerbenetz。
通过将书籍推荐给已经购买过特定书籍的顾客实现个性化推荐的。.所推荐书籍概括的分为有两种:小说书籍和非小说书籍。小说书籍的推荐很简单,就是将同一作者的其它小说书籍推荐给特定用户,这样最终就将由该作者撰写的相似类别的小说书籍推荐给了有相似背景的用户。而非小说书籍的推荐将是将每个作者的相似类别的小说书籍推荐给了有相似背景的用户。
五、电子商务推荐技术存在的问题和发展方向
综合目前电子商务中个性化推荐系统的现状可以看出,现存的个性化推荐系统技术大都是基于规则的系统,基于内容过滤的系统,以及协作过滤系统三种。而且,这些个性化推荐系统所运用的技术也仅仅限于基于内容的过滤,KNN(L-NearestNeighboring)技术,基于聚类的(Clustering-based)协作过滤,基于项目的(Item-based)协作过滤,序列模式,规则分析等等。由于这些推荐系统各自应用范围的局限,而且都不同程度的需要人工参与,因而导致目前推荐系统的推荐精确度较低。不仅如此,大多数个性化推荐系统只是给用户推荐一些不同类别的资源,这与普通的搜索引擎比较相似,而且对用户正确行为的推荐却比较少。
未来电子商务推荐技术研究的发展主要体现在以下几个方面:
1.组合推荐技术的研究
众所周知,现存的推荐技术已经得到推广和应用,但各种技术都存在一些缺陷,能否将各种推荐技术融合起来作到取长补短是未来电子商务推荐技术研究的重要课题。
2.推荐技术准确度的研究
目前的推荐技术推荐的准确性还得不到保证,准确度的研究还局限在手工实验阶段,因此,研究出自动的准确性验证理论模型就显得非常重要。
3.数据获取方面,主要还是依赖用户的显式评价,在自动获得用户的隐式信息方面做得不够。
4.研究过于集中解决推荐算法性能的提高,对推荐系统的开发与应用,尤其是与企业其它系统的集成应用,在辅助企业的市场销售,客户管理和企业商务智能方面缺乏研究。
参考文献:
[1]CooleyR,MobasherB,SrivastavaJ.Dataprepara2tionforminingworldwideWebbrowsingpatterns.JournalofKnowledgeandInformationSystems,1999(1):230~241
[2]GoldbergD,NicholsD,OkiBM,TerryD.Usingcol-muni-cationsoftheACM,1992,35(12):61~70.
[3]ResnickandVarian.RecommendationsystemsCommu-nicationsoftheACM,40(3):56C58,1997.98-122
[4]R.D.Lawrence,G.S.Almasi,V.Kotlyar,M.S.Viveros,S.S.Duri,Personalizationofsupermarketproductrecommenda-tions,IBMResearchRport,2000.43-75.
[5]邓爱林,朱扬勇,施伯乐.基于项目评分预测的协同过滤推荐算法[J].软件学报,2003,(9).
[6]曾春,邢春晓,周立柱.个性化服务技术综述[J].软件学报,2002,(10).
[7]赵亮,胡乃静,张守志.个性化推荐算法设计[J].计算机研究与发展,2002,(8).
关键词:感知价值;采纳意愿;VAM模型;移动个性化推荐
一、 引言
学者们关于用户互联网产品或服务接受意愿和使用行为的研究经常采用Davis等提出的TAM模型(Technology Adoption Model),或者在TAM模型的基础上增加一些影响用户态度和行为的因素形成扩展的TAM模型。但是,有研究表明TAM模型在研究用户自愿购物方面的解释力度不高(朱阁等,2010)。移动互联网的使用者扮演着用户和消费者的双重角色,对移动互联网的使用费用由自己承担,是否接受具有自愿性。移动个性化推荐作为移动商务发展的重要产物,是电子商务网站向移动用户推荐商品或服务信息的主要手段,这些信息能否引起用户态度和行为主要取决于用户对推荐信息的价值感知(Sabiote et al.,2012)。本文从感知价值相关理论出发,基于Kim等提出的VAM模型(Value-based Adoption Model),将用户对移动个性化推荐的价值感知分为功能价值、体验价值和安全价值三个维度,试图从收益和损失两个方面来分析影响用户移动个性化推荐感知价值的因素,并测量后者对其采纳意愿的作用路径。
二、 相关理论综述
1. VAM模型。VAM模型是Kim等(2007)基于价值最大化视角,针对用户关于移动互联网(M-Internet)的接受态度而构建的模型。该模型认为用户对移动互联网的感知价值是影响其接受意愿的主要因素,其它因素通过感知价值的中介作用影响接受意愿。在该模型中,Kim等将影响用户移动互联网感知价值的因素分为收益和损失两个维度,并进一步将感知有用性和感知娱乐纳入收益维度,将技术特性和感知费用纳入损失维度;同时研究了感知价值对用户移动互联网接受意愿的影响。
2. 感知价值。Zeithaml(1988)认为感知价值是消费者基于感知利得和感知损失两个角度,对产品效用做出的总体评价。根据研究情境的不同,学者们认为感知价值应该是一个多维度的概念。如,Sheth等(1991)提出了Sheth-Newman-Gross消费价值模型,该模型将影响用户行为的感知价值分为社会价值、条件价值、情感价值、功能价值和认知价值五个维度。在Sheth-Newman-Gross消费价值模型的基础上,Sweeney和Soutar(2001)将价格从功能价值中剥离出来,同时去掉了条件价值和认知价值,进而形成了包括质量/表现、社会价值、情感价值和价格/金钱价值四个维度的消费者感知价值模型。陈洁等(2012)把感知价值划分为功利主义价值和享乐主义价值,并进一步将前者划分为价格和品质两个子维度,后者划分为自我延伸、自我享乐和社交价值三个子维度。基于前人的研究成果,考虑到用户移动个性化推荐使用的实际情况,笔者主要从功能价值、安全价值和体验价值三个维度对用户移动个性化推荐感知价值进行测量。功能价值类似于TAM理论中的感知有用性,是用户对移动个性化推荐功能性、实用性、自然属性等方面的感知;安全价值是用户对移动个性化推荐的内容和系统基于正直、友善、可靠等方面的感知;体验价值是用户感知移动个性化推荐带来的愉悦感、满足感等。
三、 研究假设和模型
1. 感知价值与移动个性化推荐采纳意愿。移动个性化推荐是商家根据目标消费者自身或者相似消费者的消费行为和偏好,为其推荐符合当前兴趣和偏好的商品或服务信息。戴德宝等(2015)基于Sheth-Newman-Gross消费价值模型的研究表明,感知r值各个维度对用户网络个性化推荐的采纳意愿都影响显著,且VAM理论也证明了用户对移动互联网的感知价值影响其采纳意向。基于此,本文认为用户对移动个性化推荐感知价值的三个维度均正向影响其采纳意愿。考虑到用户使用移动个性化推荐主要是为了解决信息超载问题,享受移动个性化推荐带来的愉悦体验,提出假设:
H1:用户移动个性化推荐感知价值的三个维度均正向影响采纳意愿,且功能价值和体验价值对采纳意愿的影响更为显著。
2. 收益与感知价值。TAM理论中的“感知有用性”和“感知易用性”分别是指用户主观上感知信息系统提高其工作绩效的程度和使用信息系统所需付出的努力程度。移动个性化推荐的感知有用性和感知易用性主要涉及用户对产品或服务功能属性和享乐属性的感知。基于此,提出以下假设:
H2:感知有用性正向影响用户移动个性化推荐感知价值的三个维度,且对功能价值的影响最大;
H3:感知易用性正向影响用户移动个性化推荐感知价值的三个维度,且对体验价值的影响最大。
网络个性化推荐系统是商家为了解决种类繁多的商品选择同顾客相对单一的需求之间的矛盾而采用的信息工具和技术(Ricci et al.,2011)。受到移动设备屏幕小、资源有限、链接不稳定等因素的制约,移动个性化推荐系统如果不能在正确的时间、合适的地点为目标用户推荐符合其兴趣和偏好的信息,就会引起用户的心理抗拒(万君等,2015)。因此移动个性化推荐的界面设计、推荐信息数量、推荐时间和地点等情境特性都会影响用户对其的价值认知。基于此,提出假设:
H4:情境特性正向影响用户移动个性化推荐感知价值的三个维度,且对功能价值和体验价值的影响均比较大。
3. 损失与感知价值。移动个性化推荐系统在一定程度上降低了用户搜索商品或服务的时间和精力成本,但是,浏览移动个性化推荐过程中会产生流量费用、交易费用等费用,且移动个性化推涉及到了用户的隐私信息泄露问题(Bandyopadhyay,2012)。已有研究表明,移动商务环境下感知费用和安全风险显著影响用户的感知价值(周涛等,2009)。基于此,提出以下假设:
H5:感知M用负向影响用户移动个性化推荐感知价值的三个维度,且对体验价值的影响最大;
H6:感知风险负向影响用户移动个性化推荐感知价值的三个维度,且对安全价值的影响最大。
四、 实证研究
1. 问卷设计与发放。本文采用问卷调研的方式对提出的假设和模型进行检验,为保证问卷的信度和效度,问卷的测试题项均来自已有文献,通过深度访谈和预调研对问卷进行修正,最终形成本研究的正式测量量表。正式调研于2016年6月底开始,7月中旬结束。正式调研均采用李克特5级量表,从“1”到“5”分别代表“非常不同意”到“非常同意”。共收回问卷221份,剔除无效问卷17份,共得到有效问卷204份,有效回收率为92.3%。有效问卷中,男女比例接近1∶1;20岁~30岁的人群占比90.2%;拥有大学学历的人群占比67.2%,硕士及以上人群占比28.9%;手机上网年限大部分在2年以上占比超过90.0%;每天都上网的人群占比96.1%;有76%的人浏览移动个性化推荐。
2. 信度和效度分析。本文采用探索性因子分析(EFA)和验证性因子分析(CFA)对测量量表进行信度和效度检验。结果显示,整个量表的KMO值为0.877,巴特利特球形检验的结果为Sig=0.000。如表1所示,9个因子的Cronbanch's 值和组合信度(CR)值均大于0.7,说明量表的信度良好;各个测量题项的因子载荷均大于0.5,平均方差提取量(AVE)大于0.5,说明测量量表的效度良好。
3. 假设检验。本文采用AMOS21.0对研究模型进行了结构方程检验。各拟合指标值如表2所示,所有的拟合指标均在可接受范围内,可以对概念模型进行假设检验。
检验结果显示,研究模型对功能价值、体验价值、安全价值和用户移动个性化推荐采纳意愿的解释率分别为73.3%(R2=0.733)、57.3%(R2=0.573)、36.6%(R2=0.366)和89.5%(R2=0.895)。在收益对用户移动个性化推荐感知价值的影响方面:感知有用性对功能价值(0.244)、体验价值(0.205)、安全价值(0.235)均有显著正向影响,对功能价值的影响最大(P<0.001),假设H2得到完全支持;感知易用性对体验价值和安全价值的影响不明显,在0.05的显著性水平上影响功能价值(0.160),假设H3未得到实证支持;情境特性对功能价值(0.424)和体验价值(0.247)均有产生正向影响,且对功能价值的影响最大(P<0.001),对安全价值的影响不显著,假设H4得到部分支持。在损失对用户移动个性化推荐感知价值影响方面,感知费用对功能价值(-0.260)、体验价值(-0.490)和安全价值(-0.307)均产生负向影响,且对体验价值的影响最大(P<0.001),假设H5得到完全支持;感知风险对用户感知移动个性化推荐的功能价值影响不明显,对体验价值(-0.162)和安全价值(-0.311)均产生负向影响,其中对安全价值的影响最大(P<0.001),假设H6得到部分支持。在用户移动个性化推荐感知价值对采纳意愿的影响中,功能价值和体验价值对接受意愿影响显著,路径系数分别为0.426和0.578,安全价值在0.1的显著性水平上影响接受意愿,即相较于安全价值,功能价值和体验价值对接受意愿的影响更大,假设H1得到完全支持。
五、 结论与启示
1. 提升用户体验,形成用户习惯。在自愿采纳的环境中,用户对信息技术的采纳除了受到功能价值的影响外,还受到其它类型感知价值的影响。在需要付出时间和精力的移动个性化推荐情境中,用户十分在意移动个性化推荐带来的体验价值。即企业在推送商品或服务信息时,不仅要根据用户的兴趣爱好为其推荐适宜的产品或服务信息,还要注重推送信息能给用户带来的愉悦感,通过优质的推荐信息唤醒用户对移动个性化推荐积极的情感反应,进而提升用户使用移动个性化推荐的频率并最终形成用户使用习惯。
2. 关注用户收益感知。本研究发现用户对移动个性化推荐的感知易用性对体验价值和安全价值的影响不显著,这可能是由于在移动个性化推荐较为普遍的移动商务环境中,用户使用个性化推荐的难度小,更多的从其它方面来考虑移动个性化推荐带来的价值。此外,研究发现用户对移动个性化推荐的感知有用性对感知价值的三个维度均有显著影响,情境特性对功能价值和体验价值影响显著,且两者对功能价值的影响都最大;感知易用性对功能价值也有显著影响。这进一步表明:一方面功能价值对用户移动个性化推荐接受意愿起到了决定性作用;另一方面在功能满足需求的情况下,用户会追求个性化推荐带来的情感体验。分析认为:首先,企业必须切实保障移动个性化推荐的功能属性,通过优化个性化推荐的技术特性,推送准确、适时的信息为用户解决信息过载问题;其次,设计方便快捷的操作界面,用户在浏览现有信息的同时可以随时了解已有资源;最后,在关注推送信息质量和数量的同时,还要注重推送信息的界面设计、新颖性和个性化等,提升移动个性化推荐的享乐属性。
3. 降低用户损失感知。研究发现用户使用移动个性化推荐的感知费用对感知价值三个维度均产生显著影响,感知风险对安全价值和体验价值影响显著。相较于传统互联网推荐,受到移动设备屏幕显示以及移动设备个人信息存储的影响,用户浏览和使用移动个性化推荐的过程中,除了需要付出大量时间、精力和金钱以外,还可能遭受隐私、财产信息泄露的风险。分析认为:首先,企业要同移动数据服务商合作,降低用户接入互联网的成本;其次,信息推荐商家、应用提供商家、支付机构等要注重对用户信息的保护,不能随意泄露和使用用户信息;最后,构建用户对移动个性化推荐基于正直和友善的信任,降低隐私风险感知。
参考文献:
[1] 朱阁,马龙,Sangwan Sunanda,等.基于社会认知理论的消费者采用模型与实证研究[J].南开管理评论,2010,13(3):12-21.
[2] 周涛,鲁耀斌,张金隆.基于感知价值与信任的移动商务用户接受行为研究[J].管理学报,2009,6(10):1407-1412.
[3] 陈洁,王方华.感知价值对不同商品类别消费者购买意愿影响的差异[J].系统管理学报,2012,21(6): 802-810.
[4] 戴德宝,刘西洋,范体军.“互联网+”时代网络个性化推荐采纳意愿影响因素研究[J].中国软科学, 2015,(8):163-172.
[5] 万君,郭婷婷,吴正祥,等.用户对移动互联网主动式推荐信息的心理抗拒与接受意愿研究[J].北京邮电大学学报:社会科学版,2015,17(5):47-53.
基金项目:国家自然科学基金项目(项目号:71172218);高等学校博士学科点专项科研基金项目(项目号:20122121110005)。
[关键词]Web挖掘;物流信息平台;个性化推荐
[DOI]10.13939/ki.zgsc.2015.20.019
1 引 言
随着网络技术的发展,网络已经成为人们获取信息的一个重要途径。为了提高物流服务的运作效率,各种类型的物流信息平台纷纷建立。一般认为,凡是能够支持或者进行物流服务供需信息的交互或交换的网站,均可视为物流信息平台。物流信息平台汇集了物流行业各方面的信息,通过Web页面大量的物流资讯、物流人才、货运信息、物流服务等内容,给用户提供了获取更快捷、更便宜的物流服务的手段。然而,随着物流信息平台整合信息资源种类和数量的增多,如何让用户在访问网站时更准确、更快捷地获得自己需要的信息,是物流信息平台发展面临的一个问题。而目前来说,物流信息平台通常是以系统内搜索引擎或检索工具帮助用户检索网站信息,但是大多数检索功能缺少主动性,没有考虑用户的兴趣偏好和用户间的差异,所以无法满足用户对信息的个性化需求,物流信息平台亟待改进其服务质量。
借鉴电子商务网站个性化服务的应用,个性化推荐服务可以作为物流信息平台提高服务质量的一个有效途径。个性化推荐服务是根据用户的信息需求、兴趣或行为模式,将用户感兴趣的信息、产品和服务推荐给用户,这样就可以避免用户花费较多的时间进行信息筛选,使用户在更短的时间内更准确地获得自己真正感兴趣的信息。
实现个性化推荐,关键是获知和描述用户的个性特征以及兴趣偏好。考虑到物流信息平台是通过Web页面大量的信息和服务资讯,用户的访问情况可以很容易地反映出其个性特征和兴趣偏好,因此对于物流信息平台的个性化推荐服务可以通过Web挖掘技术来实现。
2 基于Web挖掘的物流信息平台个性化推荐系统
2.1 系统基本功能
个性化推荐系统的基本功能是:通过分析用户对Web访问的规律,寻找行为模式相似的用户,形成虚拟用户社区,并建立用户兴趣库,在对Web内容挖掘的基础上,将符合用户兴趣的信息资源(包括新闻、供求信息、物流服务等)推荐给当前用户。同时,利用系统建立的用户兴趣库,当用户输入关键词进行检索时,将用户检索的结果按用户的兴趣程度排序,将用户最有可能关注的信息或服务提供给用户。
2.2 系统体系结构
该系统的体系结构主要由三个部分组成:数据采集及预处理、生成推荐模型与在线推荐部分。如图1所示。
图1 基于Web挖掘的物流信息平台个性化推荐系统体系结构
数据预处理模块负责从Web服务器日志、Web使用记录等中提取、分解、合并、转换相关的数据,供数据挖掘、偏好分析及推荐引擎使用,为实现个性化推荐任务提供必要的数据。为保证提供数据的准确性,因此该模块一般要经过数据清洗(数据净化)、用户识别、会话识别、路径补充、事务识别等过程。
模式生成是指用于个性化推荐的推荐模型的生成,该阶段是推荐系统的主要部分,主要负责建立用户兴趣库和虚拟用户社区。该工作框架基于聚类算法。挖掘、创建模式数据库是一个循环往复的过程。该阶段也是离线进行,为在线实时推荐提供支撑。
在线推荐是根据用户的访问情况,将其与系统挖掘生成的模型进行匹配,找到与当前用户行为相似的虚拟社区,按照该虚拟社区用户的兴趣库实时地为用户进行在线推荐。通常采用的推荐方法为用户登录时以页面的形式给出推荐页面,也可将推荐内容发送到用户邮箱中。针对用户群建立的虚拟用户社区,可将相同的信息推荐给同一社区中的所有用户。
2.3 系统的技术实现思路
个性化推荐服务以Web内容挖掘为支撑,首先对物流信息平台上出现的物流信息进行分析,提取出关键词;根据关键词确定该资源所属的类别,对用户兴趣中对应类别的权重达到设定阈值的用户进行推荐。
个性化检索服务的工作主要是对检索结果进行2次处理。将页面内容按标题提取关键词后,根据关键词将内容归为某一类,然后根据用户的兴趣,将检索结果按与用户兴趣匹配程度从大到小排序后,再提供给用户。
3 系统关键技术
3.1 Web使用记录数据的处理
Web使用记录是用户兴趣及虚拟社区建立的关键。它所包含的内容主要来源于两个方面:一方面是Web服务器日志记录,另一方面是用户在客户端操作的记录。前者可直接从服务器日志文件中获得,但数据量庞大,需要经过数据清洗(数据净化)、用户识别、会话识别、路径补充、事务识别等一系列预处理过程;后者则必须通过对用户的浏览操作进行跟踪记录,可在网页上增加对用户下载、保存等与兴趣程度相关操作的记录,用小型的形式实现。
3.2 Web内容挖掘中页面内容的表达与分类
在个性化推荐及个性化检索服务中,首先要对待处理的资源进行分类。若考虑整个页面的内容,则虽然能得到精确的内容表达,但对正文进行处理费时太多,所以采用对标题进行关键词提取,再根据关键词进行分类的方法。分词采用分词软件完成。页面分类工作流程如图2所示。
图2 Web页面分类工作流程
分类算法有决策树分类、贝叶斯分类、基于遗传算法的分类等。该系统采用KNN分类算法。分类过程中,将训练页面及测试页面经过标题提取及分词后,形成相应的矢量。
3.3 用户兴趣的表示
用户兴趣根据用户对Web进行访问的各种浏览行为进行挖掘而得。一些典型的操作,如用户下载、较长时间的浏览、添加至收藏夹等行为,反映出用户对相关内容感兴趣。用户兴趣采用向量空间描述,形如{(A1,W1),(A2,W2),…,(An,Wn)}。Wi取值范围为[0,1],Wi值越大,说明相应的兴趣度越高。如,某用户的兴趣向量空间为{(货源,0.8),(车源,0.2)},说明该用户在货源关键词上的兴趣值为0.8,而在车源关键词上兴趣值为0.2,兴趣度较低。用户兴趣的向量空间中,每个关键词对应的权重是动态变化的。当用户进行相关内容的下载、长时间浏览等操作时,权重增加(增加至1时不再递增);若长时间未进行相关内容的浏览操作,则权重值减少。设定一个阈值,当某一关键词对应的权重低于该阈值时,将相应分项从向量空间中去除,同样,当某一新增关键词的权重高于该阈值时,要在向量空间中增加对应分项,使向量空间反映出用户兴趣的实际变化情况。
3.4 虚拟用户社区的建立与维护
虚拟用户社区的建立采用聚类的方法,将用户聚合在不同社区中。常用的聚类算法有基于划分方法、基于层次方法、基于密度方法、基于网格方法等。该系统采用较为简单的K平均划分方法进行聚类处理,设聚类后簇的数目为K,具体操作步骤是:①随机选取K个对象作为初始的K个簇的质心;②将其余对象根据其与各个簇质心的距离分配到最近的簇,再求新形成的簇的质心;③上述迭代过程不断重复,直至目标函数最小化。
为简化算法,选择最能体现用户兴趣的网络访问活动进行分析。主要考虑以下用户行为:下载资源、浏览资源。分别构建下载和浏览行为的相异度矩阵,再通过聚类算法生成虚拟用户社区。
首先构建下载行为的相异度矩阵。将下载活动表示为(userid,KJ),其中userid为用户标识,KJ为下载的资源号以及下载时间。以在一段时间内用户下载相同资源的相同程度为基础,构建相异度矩阵。如,有10个物流信息资源,编号分别为1~10,在同一段时间内用户A、B下载资源的情况为:A下载的资源集合为(1,2,5,7),B下载的资源集合为(1,2,4),A下载资源中与B相同的比例为50%,B与A相同的比例为66%,综合考虑,得A、B两个用户下载资源活动的相近程度为58%,则相异度为42%。经过处理后,得到用户下载情况的相异度矩阵。
然后构建浏览行为的相异度矩阵。用户的浏览行为与其兴趣的相关程度在很大程度上取决于浏览时间,即用户对某个页面浏览时间越长,说明该用户对页面的兴趣度越大。在以浏览行为为评价对象进行用户相似性聚类时,除了考虑用户浏览页面的相同程度之外,还应考虑浏览时间。为方便处理,将浏览时间按长短分为若干个等级,如浏览时间在1min之内,1~5min,5~10min,10min以上等。以用户在一段时间内访问相同页面时间长度等级的差异情况为主,构建相异度矩阵。
分别对上述2个相异度矩阵采用K平均划分方法进行聚类,也可以将2个相异度矩阵合并,然后进行聚类处理。合并时可以加上一定的权重,如侧重浏览行为,则对浏览情况的相异值乘上一个较大的系数B(0
用户的兴趣是动态变化的。相应的虚拟社区应根据用户的兴趣变化而变动。若某个用户的兴趣发生变化,某类兴趣值下降至设定的阈值,则将该用户从相应的社区中删除;若用户某类兴趣值增加至设定的阈值,则将该用户加入到对应的社区中。对新用户经过一段时间的浏览行为跟踪后,分配至合适的社区中。
4 结 论
随着物流信息平台整合资源和信息的增多,用户访问网站及时获取所需信息的难度越来越大,而大多数物流信息平台所具备的搜索功能又缺乏主动性。本文主要针对网站的普通用户获取信息的问题,将电子商务的个性化推荐技术应用其中。主要以Web挖掘技术从用户的浏览行为间接地获取用户兴趣进而完成个性化推荐。系统中所用的算法只是选用了相关挖掘算法中比较典型的,具体选用算法还可以进一步研究。
参考文献:
[1]赵影.基于Web使用挖掘的个性化推荐服务研究[D].大连:东北财经大学,2009.
[2]张红霞.基于Web挖掘的电子商务个性化推荐系统[J].辽宁工程技术大学学报(社会科学版),2009,11(6).
[3]陈基漓,牛秦洲.Web挖掘在农业信息网站个性化服务中的应用[J].安徽农业科学,2008,36(35).
关键词:智慧旅游;数字旅游;旅游智能推荐
1 引言
随着城市智慧旅游的建设,旅游系统的旅游资源库也逐渐庞大。如何整合这些旅游资源为游客提供一个智能化、个性化的服务,让游客在短时间内找到自己想要的旅游信息,这就需要利用数据挖掘技术开发一个数字旅游服务智能推荐系统。该系统能够根据游客的喜好、历史访问记录或其他相似客户信息为游客提供个性化的旅游服务。
2 系统设计
构建一个能充分利用秦皇岛旅游资源,为游客推荐具有秦皇岛特色旅游服务的系统是秦皇岛旅游资讯服务实现个性信息化服务的有效手段。该系统运用数据挖掘技术根据需求信息结合历史访问记录向游客推荐更符合用户需求的旅游资源。通过该系统游客可以在世界的任何地方根据自己的喜好得到实时、动态和准确的旅游资源。
2.1 系统结构
该系统是基于java、Servlet、jsp、JDBC、数据库等技术实现的以 Web 技术为核心的浏览器/服务器(B/S)模式的与平台无关的大型旅游推荐系统。系统基于J2EE三层结构设计的,分为逻辑层、表达层和数据层。系统分为GUI(图形用户接口)、智能分析、推荐引擎、旅游资源库、数据挖掘处理等几个模块。游客登录网站后,系统智能分析模块调用嵌入的Web挖掘算法根据游客以往的浏览记录为用户提供贴合用户喜好的个性化页面。而当用户通过页面输入自己要查询的信息关键词提交后,智能分析模块对用户输入的关键字进行分析,分析结果交给推荐引擎,经过数据挖掘处理模块对系统用户信息库和旅游资源库进行挖掘,得出推荐页面集,最后将推荐内容返回给用户。系统各个模块之间相互依赖,互相交互得到个性化的推荐结果集。系统结构图如图1所示:
图1 系统结构图
2.2 系统功能
旅游智能推荐系统是秦皇岛旅数字旅游系统的一个子系统,系统中嵌入了数据挖掘等技术实现了智能推荐功能,使系统可以根据用户输入需要的关键词及用户的访问记录为用户感兴趣的个性化推荐页面集。具有以下方面的功能:
a.旅游详细信息浏览。b.旅游资源库更新。c.用户查询功能。
此功能包括两个子功能:
a.分析输入的检索词及用户以往浏览记录 b.通过嵌入的数据挖掘技术对数据进行分摊返回给用户端感兴趣的个性化页面。
2.3 智能分析模块设计
(1)获取用户需求,分析用户访问记录;(2)响应用户提交的搜索请求,通过关联规则挖掘分析将列出对应的搜索结果以及相关链接返回给用户。
2.4 推荐引擎设计
用户与数据库之间是通过推荐引擎模块连接的,推荐引擎作为系统的一部分实施简单运行在服务器端,推荐引擎模块应用系统协同过滤推荐法来实现初始推荐功能。推荐引擎通过GUI模块接受用户需求,经过处理得到的数据立方体,在数据立方体上进行联机分析。
2.5 数据挖掘处理模块设计
系统实现智能推荐功能的主要模块为数据挖掘处理模块,此模块继承了多种成熟的数据挖掘算法。该模块应用合理的数据挖掘算法通过对已有数据及资源库进行数据收集、数据预处理、数据分析给用户提供个性化的旅游服务。
2.5.1 数据收集
数据预处理的前提就是做好数据收集,收集的数据源包括页面、日志以及用户的访问记录和旅游资源库的数据,分析这些数据,为数据挖掘做好充分准备。
2.5.2 数据预处理
数据分析之前需要对收集到的数据做预处理,处理成符合算法的数据集。数据预处理包括数据清洗、数据集成、数据选择和数据变换四部分。数据清洗是对收集的数据进行预处理、抽取、过滤和组织重构等操作,通过数据清洗将数据整理成具有一定主题的主题数据库,如中原山水、红色之旅等,为进一步数据挖掘提供数据基础。数据集成将不同的数据源合并成一致的数据存储,对不同城市的旅游资源包括旅游路线、就去景点、酒店预订、车票预订等进行数据分析,按照数据的相似性进行集成。数据选择通过一定的算法删除数据集中的冗余数据,达到压缩数据的目的。数据转换将数据经过合适的规范化算法整理成适合不同数据挖掘算法合适的数据形式。通过对数据进行预处理可以降低数据挖掘处理的时间,提高数据挖掘的质量,进而提高系统的效率。数据预处理是数据挖掘模块必不可少的阶段,预处理的结果直接影响着系统推荐的质量。
2.5.3 数据分析
数据分析主要由成熟数据挖掘算法组成。通过数据挖掘算法对处理好的数据进行挖掘,挖掘出符合用户需求的规则,并通过推荐引擎将分析的结果处理成个性化的推荐页面返回给浏览器端。我们的系统暂时集成了聚类和关联规则挖掘算法。
2.6 开放性智能推荐系统接口设计
为了提高系统的可扩展性,使系统可以不断的集成先进的数据挖掘算法,我们定义一组标准的接口供各类人员继承和调用。接口依据Java 语言中的 interface 类型来进行定义了,所有实现此接口的算法实例都必须实现相应的方法,从而为各种算法的实现提供了统一的规范,使得不同数据算法可以方便快速的集成。系统中的接口定义如下:
public interface IRSystem {
public String getAlgorithmName();// 数据挖掘算法名称
public String getCName();//获取所属公司名称
public String getAlgorithmDescription();// 获取算法详细描述
public String[] getRecoSets ();//获取推荐结果
public String[] getRecoSets(String[]Keys); // 根据输入的关键词获取推荐结果
public void init(String configFile); // 根据配置文件对当前推荐方法进行初始化
}
3 结束语
基于数据挖掘技术的旅游智能推荐系统,能够满足用户的个性化需求,可以智能化的向用户推荐感兴趣的旅游服务,对建设智慧旅游有着重要的意义。现有系统仅仅集成了K-聚类、贝叶斯、关联规则等几种成熟的推荐算法,随着数据挖掘算法人员的研究会有更好更有效率的挖掘算法出现,为了使系统能够很好的扩展这些算法,我们提供了标准的接口来实现这一功能,提高了系统的可扩展性。
参考文献
[1]张晗,潘正运,张燕玲.智能“旅游电子超市”的研究与设计[J].微计算机信息.2005.12,3.
[2]黄解军,潘和平,万幼川.数据挖掘技术的应用研究[J].计算机工程与应用,2003.2,45-48.
[3]钱卫宁,魏藜,王焱,钱海蕾,周傲英.一个面向大规模数据库的数据挖掘系统[J].软件学报,2002.8,1540-1545页.
[4]姚罡,麦永浩,党选举,数据挖掘在电子商务推荐系统中的应用设计[J].计算机与自动化,2002.12,39-41页.
【关键词】 个性化推荐 移动学习 混合式推荐
近年来,我国英语教学经历了一系列的改革,教学理念和教学方法都发生了巨大的变化,然而,大班教学的现状却始终未能改变。在大班条件下,有限的课堂时间使教师只能讲授语言知识,而不能为学生提供充足的语料和运用英语的机会,学生的学习需求无法得到满足。移动技术的发展为解决这一问题提供了一个契机。利用移动设备,学生可以随时随地从网上获取大量的学习资源。然而,网上海量的资源却容易造成“网络迷航”和注意力分散现象。在这种情势下,个性化推荐技术应运而生。
一、个性化学习理论
个性化学习是指学习者可以自主制定学习计划、选择学习内容,确定学习时间和学习地点的学习方式。个性化学习是在多元智能理论和元认知理论的基础上提出的。多元认知理论认为人的智力是多元的,学习者之间个体差异巨大,因此,教师应了解并尊重个体间的差异。元认知理论认为每个学习者都有独特的认知风格和认知方式,因此,教师应提供多样化的学习资源,以满足不同的认知需求。个性化学习具有学习资源的多维性、学习价值追求的多重性、学习风格的独特性、学习过程的终身性和学习方式的自主性、合作性与探究性特征[1]。
二、个性化推荐
个性化推荐是指利用用户以往的选择或相似性关系发掘用户潜在的兴趣对象,通过过滤信息为用户提供满足个性化需求的产品。个性化推荐系统通常由3部分组成:用户行为记录模块、用户偏好模块和推荐算法模块。推荐算法主要包括基于内容的推荐、协同过滤推荐、基于网络结构的推荐、基于知识的推荐、混合推荐等。
三、移动英语学习平台设计
设计移动英语学习平台是为了满足学习者个性化的学习需求,因此首先要分析用户的特点和用户的偏好以及用户间的相似关系。其次要对学习资源进行分析,包括资源的类型、特征、属性等。在此基础上利用混合式推荐,为学习者提供需要的学习材料。
3.1 平台总体结构
个性化移动英语学习平台主要由服务器和移动终端两部分组成。服务器端包括web服务器和数据库服务器。数据库服务器用于存储用户信息和学习资源,Web服务器用于上传资源和修改数据库。移动终端是指接入互联网,可以向Web服务器提出学习请求或接收资源的智能手机、平板电脑等设备。个性化移动英语学习平台架构分为三层:数据层、业务层和表现层。具体如下图所示:
数据层采集、存储学习者的基本信息和学习行为信息以及学习资源信息,并通过预加工为业务层提供信息。业务层是整个平台最核心的一层,通过数据挖掘和数据分析,对数据层传递来的信息进行过滤、分析、加工、建模以建立用户偏好模型。应用层接受用户偏好模型,并为学习者推荐个性化的学习内容。
3.2用户偏好模块
要建立用户偏好模型首先要采集和整理用户信息。用户信息包括基本信息和学习行为信息。基本信息是指用户在注册时填写的个人信息,学习行为信息是通过用户的各种学习行为采集的信息,如点击、浏览、搜索、下载、收藏、分享、评价等行为数据。服务器端对用户信息进行数据分析和建模。对于新用户基本信息的简单处理可采用决策树算法。该算法不需要了解用户背景知识,只需要对用户进行分类就可以初步预测用户对学习材料的态度。例如,儿童可能对英语儿歌感兴趣,高中生可能对语法知识感兴趣。利用决策树进行数据分类首先需用一组训练数据集来训练分类器,然后用已建好的分类器对真实用户数据进行分类。在对用户基本信息简单处理后,通过对用户的学习行为数据的分析,来建立用户偏好模型。具体方法是用关键词和相应的权值来表示偏好,对关键词权值的计算有多种方法,其中TF-IDF(词频-逆文档频率)算法简单且容易实现。
3. 3学习资源分析模块
听、说、读、写、译是英语基本技能,其中说、写属于输出性技能,听、读属于输入性技能,译则是各种技能实现的基础。为学生提供个性化推荐,主要是推荐输入性的语言材料,即听力材料和阅读材料,同时为了提高写作能力,教师也可为学生提供作文的范文。在为学生提供阅读材料和作文范文前,教师首先要了解材料中词汇的难度。词汇的难度取决于词汇的长度、音节数和使用频率。Chin-Ming Chen总结了词汇难度公式[2]:
bj =( Lj×0.7+Pj×0.3) ×Gj
其中, bj表示第j个词汇的难度, Lj表示第j个词汇的长度系数, Pj表示第j个词汇的音节长度系数, Gj表示根据词频确定的第j个词汇的难度系数。
词汇的难度对文章难度有影响,文章的类别、主题对文章的难度也有影响。最常用的文本表示方法是向量空间模型。在向量空间模型中,每个特征项对分类有不同的贡献,因此需要进行权重计算。为了使用户描述文件和学习资源描述文件的表达方式一致,对学习资源文件也采用TF-IDF算法来计算。
同样,在向学生推荐写作范文时,也需要了解文档的相似度,也可采用TF-IDF算法来进行相似度判断[3]。为学习者提供听力材料的过程较为复杂,由于计算机不具备人脑的智能,因此难以分析音、视频材料的难度和主题。因此需要教师为听力材料标注难度、主题、类型等,系统在结合用户学习需求的基础上为用户提供个性化的听力材料。
3.4个性化推荐模块
由于移动终端数据存储、处理能力有限,因此本平台的个性化推荐模块在服务器端实现。推荐算法选择基于内容的推荐算法。该算法对用户和学习资料分别建立配置文件,通过分析用户浏览的内容,建立用户的配置文件,通过比较用户与学习资料的相似度,向用户推荐与其最匹配的学习资料。基于内容的推荐可以处理冷启动问题,而且本平台的学习资料多为文本资料,多媒体资料经过标识,已便于计算机识别和处理,因此基于内容的推荐算法更为适用。
本文将个性化推荐技术应用于移动英语学习中。通过对学习者基本信息和学习行为信息的采集和处理,建立用户偏好模型,通过对学习资料的分析建立学习资料模型,运用基于内容的推荐算法将用户信息与学习资料信息相匹配,并将最匹配的材料发送至用户的移动设备上。本平台节约了学习者大量的资料搜索和选择时间,缓解了“网络迷航”状况,提高了英语学习效率。
参 考 文 献
[1]李广,姜英杰.个性化学习的理论建构与特征分析[J].东北师大学报(哲学社会科学2005,(3):152