语义Web技术和点击流数据集市在旅游电子商务网站中的应用研究

VIP免费
3.0 陈辉 2024-11-19 5 4 2MB 92 页 15积分
侵权投诉
I
摘 要
现有的 Web 环境对语义的支持比较弱,不利于信息的共享和交换。语义 Web
是对当前 Web 的扩展,它通过 XMLRDF 以及本体等技术,使 Web 具有结构化
特性和语义特性,在一定程度上缓解机器可理解的语义信息匮乏的问题。
随着 Web 应用范围的广泛,点击流信息资源开发在帮助网站适应用户需求,
提高 Web 站点用户满意度方面作用显著。然而目前的点击流信息资源开发仅限于
语法层次,即只能在纯粹形式化的水平上进行识别、推理和判断,准确度低,用
户兴趣满足程度低。鉴于此,本文将基于本体的语义 Web 技术引入到点击流信息
资源开发中,使 Web 应用系统既利用语法层次的点击流信息又能整合语义层次的
点击流信息,从而提高用户兴趣满足感,更好地为 Web 用户服务。
本文主要完成以下工作:
1、将语义 Web 技术引入点击流信息资源开发中,利用站点领域本体,将点
击流信息由语法层次转化为语义层次,进而进行语义层次的逻辑推理,提炼出电
子商务网站关心的信息。
2提炼语义层次点击流信息资源开发方法,针对各开发环节的语义转换均依
赖于同一统计信息――领域本体概念实例权重的问题提出将个性化推荐集生成过
程进行改进,采用结合语义距离和统计信息的语义相似度算法进行语义用户会话
和语义使用文档的相似度匹配,且该相似度算法可以通过调整参数的值来改善原
算法的通用性极差的问题。
3在遵循领域本体建立准则的基础上,根据领域本体的知识工程构建方法构
造领域本体库,支持语义层次的点击流信息资源的开发。
4在分布式本体环境下引入多 Agent 技术,结合语义 Web Web 挖掘的特
点,提出基于多 Agent 的本体挖掘系统框架模型,对各 Agent 的功能进行严格划
分,实现全局本体与局部本体之间的调用与通信,协助本体更好地发挥作用。
5结合旅游电子商务特点,以点击流信息资源为基础,综合运用基于本体的
语义 Web 技术、点击流数据集市技术和个性化推荐技术,研究、设计并实现一种
旨在能够有效提高“浏览-预订比率”将潜在旅游者转化为实实在在的游客的电
子商务个性化推荐系统模型。
关键词:语义 Web 本体 点击流信息 Agent 旅游电子商务 个
性化推荐
II
ABSTRACT
The support of existing Web environment to semantic is relatively weak,is not
conducive to information sharing and exchange. Semantic Web is an extension of the
current Web,it makes Web structured and semantic through technologies such as XML,
RDF and ontology,it alleviates the problem of machine-understandable semantic
information scarcity at a certain extent.
With the range of Web application widing, click-stream information resources
development is very helpful to Web site to adapt to user needs and improve the
customer satisfaction.But the current click-stream information resources development
is limited to the level of grammar,that is,it only can distinguish,reason and gudge, low
accuracy and low level of users’ interest satisfication.Because of this,this paper brings
ontology-based semantic Web technology into click-stream information resources
development,thus improve users’ interest satisfaction,serve for Web users better.
In this paper, the following tasks are completed:
1.Bring semantic Web technology into click-stream information resources
development,making the use of the site domain ontology, transform click-stream
information from the level of grammar into a semantic level, thus reason the logic on
semantic level,and extract the concern information to e-commerce sites.
2.Extract click-stream information resources development methodology of the
semantic level,for the problem that the semantic conversion of every development
aspects are dependent on the same statistical information- the concept of domain
ontology instances weight, improve the process of generating personalized
recommendations,use semantic similarity algorithm which is the combination of
semantic distance and statistics information to match the similarity of semantic user
session and semantic using document, and the similarity algorithm can adjust the value
of the parameter to improve the very poor general problem of original algorithm.
3.On the base of complying with the guidelines of establishing domain ontology,
build domain ontology database according to knowledge engineering methods of
domain ontology,to support click-stream information resources development on the
semantic level.
4.Brings multi-Agent technology into distributed Ontology environment,presents
ontology mining system framework model based on multy-Agent according to the
III
semantic Web and Web mining features,carry out a strict division of the functions of
the Agent,realize the call and communication between the overall ontology and local
ontology to help better the role of ontology.
5.Combining the characteristics of tourism e-commerce,based on click-stream
information resources,according to ontology-based semantic Web technology,
click-stream data mart technology and personalized recommendation technology,
research, design and realize the system model of e-commerce personalized
recommendations system.The purpose is to effectively improve the "Browse -- Book
ratio,convert potential tourists to the real tourists.
Key Word the semantic Web,ontology, click-stream information,
multi-Agent,travel e-commerce,personalized recommendations
目 录
....................................................................................................................... I
ABSTRACT ............................................................................................................II
第一章 ...................................................................................................... 1
§1.1 课题研究的目的和意义..........................................................................1
§1.2 国内外的发展现状..................................................................................3
§1.3 论文的主要工作和内容..........................................................................4
第二章 语义 Web 技术和点击流数据集.........................................................6
§2.1 基于本体的语义 Web ............................................................................. 6
§2.1.1 语义网的思想及体系结构...........................................................6
§2.1.2 本体及其相关技术.......................................................................9
§2.1.3 语义网与本体的关系.................................................................17
§2.2 点击流信息资源开发............................................................................18
§2.2.1 点击流信息.................................................................................18
§2.2.2 点击流数据集市.........................................................................20
§2.2.3 点击流信息资源开发方法.........................................................23
第三章 基于 Agent 的电子商务网站本体架构模型设计 ................................ 26
§3.1 本体的构建............................................................................................26
§3.1.1 站点领域本体的构建方法.........................................................26
§3.1.2 旅游领域本体的构建.................................................................28
§3.1.3 领域本体知识库的构建.............................................................36
§3.2 Agent 技术介绍 ...................................................................................... 38
§3.2.1 Agent 定义 ................................................................................... 38
§3.2.2 Agent 模型 ................................................................................... 39
§3.2.3 Agent 通信语言 ........................................................................... 40
§3.2.4 Agent 系统介绍.....................................................................41
§3.3 基于 Agent 的电子商务网站本体架构模型设计................................44
§3.3.1 分布式本体的定义及结构.........................................................44
§3.3.2 分布式本体中的多 Agent 架构.................................................45
§3.3.3 Agent 分布式本体架构实现细节.........................................47
第四章 语法层次向语义层次的转化研究 ........................................................ 54
§4.1 语法层次点击流信息开发方法............................................................54
§4.1.1 Web 使用挖掘常用技术 ............................................................. 54
§4.1.2 Web 使用挖掘流程 ..................................................................... 55
§4.1.3 Web 使用挖掘优缺点 ................................................................. 56
§4.2 语义层次点击流信息开发方法............................................................57
§4.2.1 识别语义用户会话.....................................................................57
§4.2.2 导出语义层次使用文档.............................................................58
§4.2.3 生成个性化推荐集.....................................................................61
§4.3 个性化推荐集生成方法的改进............................................................62
§4.3.1 语义相似度计算方法比较.........................................................63
§4.3.2 适合生成个性化推荐集的语义相似度算法.............................65
第五章基于 Agent 和语Web 技术的旅游电子商务个性化推荐系统构.. 67
§5.1 系统设计目标........................................................................................68
§5.2 系统工作流程........................................................................................69
§5.3 系统功能模块........................................................................................71
§5.3.1 信息处理中心.............................................................................72
§5.3.2 本体中心.....................................................................................74
§5.3.3 偏好中心.....................................................................................75
§5.4 系统实现技术........................................................................................76
§5.4.1 网页关键词的提取.....................................................................77
§5.4.2 用户当前会话的识别.................................................................77
§5.4.3 点击流数据集市.........................................................................80
第六章 总结与展............................................................................................ 84
§6.1 论文总结................................................................................................84
§6.2 工作展望................................................................................................85
参考文献 .................................................................................................................86
在读期间公开发表的论文和承担科研项目及取得成果 .................................... 88
.....................................................................................................................89
第一章 绪论
1
第一章 绪 论
§1.1 课题研究的目的和意义
Web已经展成为一个巨的全球化信息源库。Web上的信息高速增长
使得用户发现其所需要的信息变得非常困难。现有互联网技术的核心是超文本系
统,它的主要思想是通过统一资源标识符URI对互联网上的信息进行标识,使人们
可以迅速地对互联网上的信息进行定位。然而,现有互联网技术并没有对信息的
含义进行描述,计算机在处理信息时只是按照URI来定位信息,但对信息的内容并
不关心。而人们真正关心的是信息的内容,也就是互联网上的文本、图片等资源
所包含的意义,这就要求给出一种计算机能理解的表示资源的手段,以有效地表
示Web息。Berners Lee于2000在XML 2000的会议正式出了Web的
念,其目标是使得Web上的信息具有计算机可以理解的语义,满足智能软件代理对
Web上信息的有效访问[1]
在语义Web中,本体ontology)具有非常重要的地位,是解决语义层次上Web
信息共享和交换的基础。本体是对概念体系的明确的、形式化的、可共享的规范
说明。本体对概念进行了严格定义,并通过概念之间的关系来确定概念的精确含
义,表示共同认可的、可共享的知识,从而解决同一概念有多种词汇表示和同一
个词汇有多种概念(含义)的问题。将本体技术引入Web技术中,将从根本上解决
目前Web的信息格式的异构性、信息语义的多重性以及信息关系的匮乏和非统一
性。本体是实现资源共享和应用协作的前提。
基于Web信息统与传的基于内联网信息系统比,其Web用户的高
自治性使得Web用户具有很强的心理优势,真正成为了“上帝”,而网站管理者对
于用户的控制却越发困难。为了使网站的浏览者转变为实实在在的购买者,尽可
能防止浏览者在短时间内放弃浏览网站,提高其对网站的忠诚度,对于网络企业
的浏览者行为进行分析的需求不断增长,而解决这一问题主要要依靠对点击流信
息资源的开发利用。
狭义地讲,网站上的每个用户的每一次点击都会被记录在网页服务器的日志
文件中,即所谓的点击流信息。点击流信息具有以下特点:
实时性:只要用户对站点进行访问,用户的访问信息就会被记录。
可靠性:只要户访问Internet那么然至少有一个务器录其访问
为。
海量:中等大小的网站每天可记载几兆的用户访问信息,记载着数万次用户
摘要:

I摘要现有的Web环境对语义的支持比较弱,不利于信息的共享和交换。语义Web是对当前Web的扩展,它通过XML、RDF以及本体等技术,使Web具有结构化特性和语义特性,在一定程度上缓解机器可理解的语义信息匮乏的问题。随着Web应用范围的广泛,点击流信息资源开发在帮助网站适应用户需求,提高Web站点用户满意度方面作用显著。然而目前的点击流信息资源开发仅限于语法层次,即只能在纯粹形式化的水平上进行识别、推理和判断,准确度低,用户兴趣满足程度低。鉴于此,本文将基于本体的语义Web技术引入到点击流信息资源开发中,使Web应用系统既利用语法层次的点击流信息又能整合语义层次的点击流信息,从而提高用户兴趣满...

展开>> 收起<<
语义Web技术和点击流数据集市在旅游电子商务网站中的应用研究.pdf

共92页,预览10页

还剩页未读, 继续阅读

作者:陈辉 分类:高等教育资料 价格:15积分 属性:92 页 大小:2MB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 92
客服
关注