基于XML的通用数据平台的研究与实现
VIP免费
摘 要
随着信息化程度的不断加深,导致在现实中企业内部以及企业之间存在着多
个互相独立的信息系统,结果形成信息孤岛。伴随应用需求越来越广泛,需要将
各系统集成起来。因此,迫切需要建立通用数据平台,来提供信息共享、决策支
持以及各种信息服务[1]。
XML 的出现使得对各种规则信息及不规则信息的标准化描述成为可能,
XML 作为一种可扩展标记语言,其自描述性使得 XML 本身非常适用于异构数据
源间的信息交换。
XML 结构化的数据可以从业务规范和表现形式中分离出来,非
常有利于进行交换和处理。所以它一经出现就成为新一代数据交换的标准[2]。
本文首先介绍了XML语言知识及其与各数据库之间进行数据交换的关键技
术,并结合数据集成系统的特点和需求,在研究现有基于XML的数据映射算法和
模型的基础上,建立了基于 XML 异构数据源的数据转换模型,并对转换过程中
的模式翻译和模式集成部分制定了详细的转换规则,转换过程中尽可能地保留了
关系数据库的实体完整性约束、参照完整性约束和绝大部分的用户自定义完整性
约束。然后,针对外部用户对异构数据库系统的查询操作,从分解查询语句,合
并各数据源查询结果到最终返回用户需要的结果,给出了一个完整的查询处理过
程。最后,论文基于微软的Visual Studio.net2005开发平台实现了该转换模型,建立
了一个模拟的通用数据转换平台,并以SQL Server2000及Oracle9i为例,实现了外
部应用对异构数据源的透明访问。
关键词:XML 异构数据集成 数据交换 公共数据模型
ABSTRACT
Be accompanying informatization degree ceaselessness being deepened by, be
leading to in reality, information system that existence is burning being independent
much each other between the enterprise inside and enterprise, result forms the
information isolated island. The need adjoint is applied is more and more broad, needs
to get up with every system integration. Therefore, urgent need builds the data
platform being applied or used universally, hold out and various information service
coming to provide information share , making policy[1].
Become possibility that the normalizing can be used to various regulation
information and irregular information appearing on XML's is described, XML is one
kind of expansion mark language, The data architectural-rization separates out XML in
being able to be standard from business and showing a form, very beneficial to
carrying out exchange and handling. Therefore it becomes the new generation data
exchanged standard right away once appearing [2].
the main body of a book is analysed first throughly carrying out the data
exchanged between XML language and every data base, be tied in wedlock the
systematic characteristic of data integration and need, have built XML isomerism data
source-based data change model on the basis studying the data now having
XML-based shines upon the algorithm and the model,the integrated part has worked
out conversion rule, the consumer self definition completeness constraint consulting
completeness constraint and most as far as possible to pattern translation and pattern in
conversion process. specifically for the outside consumer inquires about a sentence to
isomerism Database inquiry operation, from decomposition, inquiring about result
having given a entire inquiry treatment out process to the result returning to the
consumer need ultimately. Take SQL Server2000 and Oracle9i as example together the
thesis should change a model finally, owing to that Microsoft Visual Studio.net2005
has developed platform realization, have built be applied or used universally that one
simulates data change platform, the lucency, having realized the outside applying to
isomerism data source visits.
Keywords: XML heterogeneous database system, heterogeneous data
integration, common data model
目 录
摘 要 ........................................................................................................................... 1
ABSTRACT .................................................................................................................. 2
目 录 ........................................................................................................................... 3
第一章 绪 论 ........................................................................................................... 1
§1.1 问题的研究背景 ............................................................................................. 1
§1.2 论文研究内容及其组织结构的安排 ............................................................. 2
第二章 XML 及相关技术 ......................................................................................... 4
§2.1 XML 技术 .......................................................................................................... 4
§2.1.1 DTD .........................................................................................................5
§2.1.2 SAX 与DOM ...........................................................................................5
§2.1.3 XPath ...................................................................................................... 6
§2.1.4 XSL 和CSS .............................................................................................. 6
§2.1.5 XQuery ....................................................................................................7
§2.2 XML 与数据库技术 .......................................................................................... 8
§2.3 XML 与数据交换技术 ...................................................................................... 9
§2.4 选择 XML 模式描述语言 .............................................................................. 10
第三章 异构数据库集成 ......................................................................................... 12
§3.1 异构数据库集成策略 .................................................................................... 12
§3.2 异构数据库集成问题分析 ............................................................................ 17
§3.3 异构数据库的数据集成方法 ........................................................................ 18
§3.3.1 数据库转换 ......................................................................................... 18
§3.3.2 数据的透明访问 ................................................................................. 21
第四章 通用数据平台的技术研究 ......................................................................... 25
§4.1 XML 与异构数据库集成系统设计 ................................................................ 25
§4.2 XML 与关系数据库之间的映射方法 ............................................................ 27
§4.2.1 基于模板驱动的映射方法 ................................................................. 28
§4.2.2 基于模型驱动的映射方法 ................................................................. 28
§4.3 基于 XML 的公共数据模型 ........................................................................... 31
§4.3.1 公共数据模型 ..................................................................................... 31
§4.3.2 基于 XML 的公共数据模型 ............................................................... 33
§4.4 通用数据平台实现的关键技术-模式转换 ............................................... 34
§4.4.1 模式转换的两个阶段 ........................................................................ 34
§4.4.2 模式翻译阶段 .................................................................................... 35
§4.4.3 模式集成阶段 .................................................................................... 42
§4.5 查询处理 ........................................................................................................ 49
§4.5.1 异构数据库系统的查询处理 ............................................................ 49
第五章 通用数据平台的实现 ................................................................................. 55
§5.1 开发工具 ....................................................................................................... 55
§5.2 系统框架 ....................................................................................................... 55
§5.3 建立全局模式 ................................................................................................ 57
§5.3.1 模式翻译阶段 ..................................................................................... 60
§5.3.2 模式集成阶段 ..................................................................................... 64
§5.4 对全局模式的查询及处理 ................................................................................. 65
第六章 总结与展望 ................................................................................................. 69
§6.1 论文工作总结 ................................................................................................ 69
§6.2 后续工作展望 ................................................................................................ 69
参考文献 ..................................................................................................................... 71
在读期间公开发表论文和承担科研项目及取得成果 ............................................. 73
致谢 74
第一章 绪论
1
第一章 绪 论
§1.1 问题的研究背景
今天,越来越多的应用需要访问各种异构数据源。对于企业应用来说,这既
是企业内部发展的需要,也是各企业之间提供信息共享、决策支持的需要。
企业在发展过程中积累了大量数据信息。然而,由于实施数据管理系统的阶
段性、技术性以及其他经济和人为因素的影响,以致,在一个企业内部以及各企
业之间,形成了信息孤岛。尽管这些数据管理系统能够满足数据存储和管理要求,
但是在许多情况下,为完成一项系统工作,企业应用可能需要相互访问。因此,
需要一个强大的系统能够集成存在于分布数据源的数据。
伴随信息化程度的加深,现在的企业比以往任何时候都需要将数据进行发布
和交换,这必然导致越来越多的企业应用需要访问各种异构数据源,并且这些数
据源可能分布在网络上任何地方。为了满足这种需求,必须有一种系统能够支持
异构数据源的数据集成。所以,无论从企业自身发展角度,还是从企业间数据集
成的角度来看,越来越多的企业应用,需要一种异构数据合成系统作为访问异构
数据源的支撑。
异构数据源集成是数据库领域的经典问题,并随着XML技术的兴起,再次成
为了该领域研究的一个热点。从为企业应用构建支撑系统的角度来讲,必须考虑
企业异构数据在集成过程中所遇到的特殊问题。总的来看,在构建异构数据源集
成系统时,主要会面对以下几方面问题[3]:
1.异构性
异构性是异构数据集成必须面对的首要问题,其主要表现在两个方面::
系统异构,数据源所依赖的应用系统、数据库管理系统乃至操作系统之间的
不同构成了系统异构。
模式异构,数据源在存储模式上的不同。一般的存储模式包括关系模式、对
象模式、对象关系模式和文档嵌套模式等几种,其中关系模式为主流存储模式。
需要注意的是,即便是同一类存储模式,它们的模式结构可能也存在着差异。例
如Oracle所采用的数据类型与SQL Server所采用的数据格式并不完全一致。
2.完整性
同构分布式数据库一般没有分布式完整性问题,因为其分布式数据库设计都
基于 XML 的通用数据平台的研究和实现
2
是采用“从上到下”的方法:首先定义约束条件,再以一致性的方式将其合并到每一
个局部的完整性子系统中去。可是在异构的多数据库系统中,全局数据库与局部
数据库是层次划分的,要保持完整性比较困难。
异构数据源数据集成的目的是为应用提供统一的访问支持。为了满足各种应
用处理数据的条件,集成后的数据必须保证一定的完整性,包括数据完整性和约
束完整性两个方面,其中约束完整性是本文研究的重点。
约束完整性中的约束是指数据与数据之间的关联关系,是唯一表征数据间逻
辑的特征。保证约束的完整性是良好的数据发布和交换的前提,可以方便数据处
理过程,提高效率。
3.性能
网络时代的应用对传统数据集成方法提出了挑战,提出了更高的标准。
4.语义冲突
信息资源之间存在着语义上的区别。这些语义上的不同可能引起各种矛盾,
从简单的名字语义冲突,到复杂的结构语义冲突。语义冲突会带来数据集成结果
的冗余,干扰数据处理、发布和交换。所以如何尽量减少语义冲突也是数据集成
的一个研究热点。
集成两个或多个数据源的时候,数据源的数据之间可能存在着某种联系。把
这种逻辑联系附加到集成结果中的过程就成为附加约束。
5. 集成内容限定
多个数据源之间的数据集成,并不是要将所有的数据进行集成,那么如何定
义要集成的范围,就构成了集成内容的限定问题。
§1.2 论文研究内容及其组织结构的安排
本文首先介绍了 XML 相关知识及其与数据库交换的技术,然后讨论了结构化
的异构数据库集成时所面临的问题,集成的策略以及所采用的技术,对比传统数
据集成技术,并在其基础上提出了一个基于 XML 的通用数据平台的总体解决方
案,并实现了其中的核心子系统,即模式转换系统。该平台将 XML 作为中间件,
将各种异构数据源都转换为 XML 文档来实现数据集成。
具体章节安排如下:
第一章即本章是对论文的课题来源及意义进行了一个综合性的阐述,然后对
主要研究内容进行了简单的介绍,同时,也对整篇论文的结构进行了一个章节性
的安排。
摘要:
展开>>
收起<<
摘要随着信息化程度的不断加深,导致在现实中企业内部以及企业之间存在着多个互相独立的信息系统,结果形成信息孤岛。伴随应用需求越来越广泛,需要将各系统集成起来。因此,迫切需要建立通用数据平台,来提供信息共享、决策支持以及各种信息服务[1]。XML的出现使得对各种规则信息及不规则信息的标准化描述成为可能,XML作为一种可扩展标记语言,其自描述性使得XML本身非常适用于异构数据源间的信息交换。XML结构化的数据可以从业务规范和表现形式中分离出来,非常有利于进行交换和处理。所以它一经出现就成为新一代数据交换的标准[2]。本文首先介绍了XML语言知识及其与各数据库之间进行数据交换的关键技术,并结合数据集成...
相关推荐
作者:陈辉
分类:高等教育资料
价格:15积分
属性:76 页
大小:1.06MB
格式:PDF
时间:2024-11-19