多机群网格的数据负载均衡模型

VIP免费
3.0 高德中 2024-11-19 5 4 568.5KB 63 页 15积分
侵权投诉
摘 要
随着数据密集型的广泛应用,海量数据也呈现在社会的各个领域。因而如何有
效的管理和高效的使用这些海量据是摆在人们前的一个重要任务。网格计
为海量数据的管理提供了强有力支持。利用多计算机机群构建多机群网格
实现海量数据的管理是一个有效途径。由于多群的节点具有异构特性,能
的不均衡性,致使海量数据的查系统实现比较难。其中数据负载均衡问题
一个研究的热点。
在多个计算机构成的网格环境下为了提高多机网格的异构资源的利用
提出了一个数据负载均衡模型。模型涉及的关技术包括TCP/IP 协议,Java
多线程技术,Java Socket 通信技术,JDBC 技术,海量数据的预处理及其批处理
技术,索引技术等。
研究1.构建机群网格
资源,这些资源主要包括控制节点,数据库服务器,查询节点,互连网络等。 2.
确定多机群网格的资源评价参数主要根据查询点的计算能力,存储能力,
信能力等因素来计算查询节点的合性能,再按该综合性能划分数据,从而
现查询节点的综合性能和所分配的数据相匹配,进而达到数据负载均衡的目的。3.
数据负载均衡算法:提出在多机网格环境下的个通用数据负载均衡算法以
一个针对 Join 操作的数据负载均衡算法。4.针对两类算法的相关试验以及相关分析
关键词:多机群网格 异构资源 数据负载均衡 数据饱和度
ABSTRACT
With broad application of data denseness,massive data take on social every
domain.So how to manage and use it effectually is an important task for people. Grid
computing provides strong support for massive data management. Utilizing mutiple
computer clusters to construct mutiple clusters grid which actualize massive data
management is an effective approach.Because of heterogeneous characteristic of node
of mutiple clusters,its capability imbalance,it makes more difficult to realize query
system of massive data.Data load balance is one of hot research questions.
To improve heterogeneous resource’s using efficiency in multi-cluster grid that is
constructed by multi-computers,a data load balance model is proposed.The key
technology about the model are including TCP/IP protocol,Java multiple thread
technology, Java Socket communication technology,JDBC technology , preparation and
batch processing of massive data,and index technology and so on.
Research work are including as follows: 1. The framework of multiple clusters grid
is constructed,and the resources of in MCG are confirmed,and these resources are
including mainly control nodes, database service nodes,query nodes and interconnected
network and so on. 2.The resource evaluating parameters are fixed on which are used to
compute query node’s integrative capability according to query node’s capability of
computing ,storage and communication, then data partition is in accordance with the
integrative capability,and the purpose of data load balance can be achieved. 3. Data
load banlance algorithm: a universal data load banlance algorithm and a data load
banlance algorithm aiming at join operation are proposed in MCG. 4.The experimens
are about two kinds of algorithm and the interrelated analyses.
Key Word Multi-Cluster Grid , heterogeneous resource , data load
balance , data saturation
目 录
摘要
ABSTRACT
第一章 绪论.....................................................................................................................1
第二章 相关技术概述.....................................................................................................3
§2.1 可扩展的并行计算机体系结构.......................................................................3
§2.2 机群技术...........................................................................................................6
§2.3 网格技术...........................................................................................................8
§2.4 负载均衡.........................................................................................................10
§2.5 数据分布方法.................................................................................................12
第三章 主要关键技术...................................................................................................15
§3.1 TCP/IP 协议....................................................................................................15
§3.2 Java 多线程技术.............................................................................................17
§3.3 Java Socket 通信技术.....................................................................................21
§3.4 数据库存取技术.............................................................................................22
§3.5 数据库的完整性.............................................................................................25
§3.6 索引技术.........................................................................................................26
第四章 多机群网格 MCG............................................................................................31
§4.1 多机群网格 MCG 的体系结构......................................................................31
第五章 数据负载均衡算法..........................................................................................36
§5.1 第一类数据负载均衡算法.............................................................................36
§5.1.1 算法相关概念.......................................................................................36
§5.1.2 算法描述...............................................................................................37
§5.2 第二类数据负载均衡算法.............................................................................39
§5.2.1 相关定义...............................................................................................39
§5.2.2 算法描述...............................................................................................41
第六章 试验及其分析...................................................................................................44
§6.1 试验环境及其应用背景.................................................................................44
§6.2 试验的关键实现部分.....................................................................................45
§6.2.1 数据库管理类.......................................................................................45
§6.2.2 产生初始数据的的相关类...................................................................49
§6.2.3 文件传输相关类...................................................................................57
§6.3 第一类数据负载均衡算法试验.....................................................................62
§6.4 第二类数据负载均衡算法试验.....................................................................64
第七章 结束语...............................................................................................................65
参考文献.........................................................................................................................66
第一章 绪论
第一章 绪论
突破单机计算能力限制的一个根本途径是实现并行计算[1-4]自上个世纪90
代以来,并行计算得以空前的飞发展,一方面由于单处理机的计算速度不
提高,并行计算机的体系结构趋成熟,数据传网络的标准化和传输速率的
幅提升,使得并行计算机的研制期能够从几年几个,为研制行计算机
创造了有件。一方面,计算发展的主力来自于国际的一
些重要研究计划。如美国HPCC 计划,美国ASCI 计划。,高性能大模并行计
算机用高成本高,一难以承受,而机群[5-7]计算可以提供高性价比的高
性能计算服务。型的机群系统有曙光2000/3000 , IBM SP ,Beowulf 机群等。
网格[8-11]( Grid) 是利用高速国际或专用网络把地球上广泛分布的计算资源
存储资源通信资源网络资源件资源数据资源资源知识资源等连成
, 实现用在格网这个虚拟组织环境上进行资源
消除息孤岛和资源孤岛
随着数据密集型的广泛应用,海量数据也呈现在社会的各个领域。因而如何有
效的管理和高效的使用这些海量据是摆在人们前的一个重要任务格计
[12-16]为海量数据的管理提供了强有力的支持。利用多个计算机机群[17-18]构建多机
群网格来实现海量数据的管理是个有效的途径由于多机群的节点具有异构
性,能力的不均衡性,致使海量据的查询系统现比较困难。其中数据负载
衡问题是一个研究的热点。有关数据负载均衡文献[19-23]多。文献[19]提出一个
分布数据处理中的负载分配策略在分布数据系统中, 查询网络数据
常需要在多计算机上, 计算机查询网络的一个,
们相互合作共同完成连查询任务。数据速发生较大波动时, 会引
关连查询, 从而影响整个连查询网络的数据处理能力。针对这一实
问题, 分析了分布数据系统和连查询网络的特点以及现有负载处理方法 ,
了问题的划模型, 提出了分布数据处理的一负载分配策略策略
操作为本负载移动, 保证系统负载衡的前提下, 极小化节点的数据传
输量。文献[20]提出并行计算中能的集群负载模型。该模型根据模拟水在多
器中理,义系统负载的。根据负实现异构集群的负
均衡。文献[21]提出一的分布WFMS 负载度算法,单节点引
重的问题负载衡技术比算法擎间负载
本均衡。擎间任务度出现不,节点负载节点出
故障时,能够根据相应模型动态调整各节点的负载,
也可以在一定程度上解决大量分布式事务处理的性能问题。另外,负载
度算法实,。文[22]提出合划
负载均衡资源分配算法针对多处群集系统多个任务处理要的资
多个处理节点能够提供的m 的合理匹配问,出了多集合划分问题的
化模型,定义了资源均衡度,提出多集合划分负载均衡资源化分配算法,
该算法可以得到资源匹配NP问题的较优解
这些不能满足多机群网格环境下的海量数据查询。本文根据多机群网格的
体系结构,实现数据的划分。根查询节点的计能力,存储能力,通信
力等因素来计算查询节点的综合能。根据该综性能划分数据[24-26]而实
查询节点的综合性能和所分配的据相匹配,进达到数据负载均衡的目的,
1
多机群网格的数据负载均衡模型
文中提出在多机群网格环境下的一个通用数据负载均衡算法。
在多机群,;
操作[27-29]率的关键; [30]
重要因素.人们相提出了一些数据分布方法,其中包括一数据分布和多
分布
数据分布方法有Round-Robin, Range数据分布方法不能有效
持在. , 文献[31]Magic
数据分布方 ,及文献[32]提出CMD 方法。管上述数据划分方法有各自
优势定在各个节点的负载性能[33]是一的前提下而进行数据划分
的。这些方法既没节点的实负载性能有考到数
系。本文个关数据分布利用该关分布生成
集合从而系统数据据各个机群的负载能力的分配到应的机群中。
样就把同所有相关存储查询节点上。本文的方
避免了连大量元组节点的连,大减少多机群网格环境下
的查询中的通负载 ,提高了系统的查询效率[34]提出一个针对Join操作的
数据负载均衡算法。
最后文中对于两个算法出了试验相应的结试验分析践表
机群网格的数据负载模型具有均海量数据的查任务,有解决多机
格环境下的数据负载问题。该模型具有良好动态性,可扩展性。
2
第二章 相关技术概述
第二章 相关技术概述
§2.1 可扩展的并行计算机体系结构
并行计算机随芯片的发展,。目前并行计
机的性能已经接近100TFLOPS1000TFLOPS 的并行计算机中。
根据指令流和数据的不,通常把计算机系统分为四类:
指令流单数据流(SISD);指令流多数据流(SIMD
指令流单数据流(MISD);指令流多数据流(MIMD
并行计算机系统除少期的、专用的SIMD系统大部分为MIMD系统。目
前 主 要 的 并 行 计 算 机 系 统 有 : 并 量 机 PVP Parallel Vector
ProcessorSMP,Symmetric Multiprocessor
MPPMassively Parallel ProcessorCluster式共享存储多
处理机DSMDistributied Shared Memory这五类计算机系统代当今世界
并行计算机的主要体系结构。介绍一下SMPDSMMPP
多处理机系统SMP
2.1是对多处理机系统的单结构,由处理单元、高速线或交叉
、共享内存以及I/O 成。
3
摘要:

摘要随着数据密集型的广泛应用,海量数据也呈现在社会的各个领域。因而如何有效的管理和高效的使用这些海量数据是摆在人们面前的一个重要任务。网格计算为海量数据的管理提供了强有力的支持。利用多个计算机机群构建多机群网格来实现海量数据的管理是一个有效的途径。由于多机群的节点具有异构特性,能力的不均衡性,致使海量数据的查询系统实现比较困难。其中数据负载均衡问题是一个研究的热点。在多个计算机构成的网格环境下,为了提高多机群网格的异构资源的利用率,提出了一个数据负载均衡模型。该模型涉及的关键技术包括:TCP/IP协议,Java多线程技术,JavaSocket通信技术,JDBC技术,海量数据的预处理及其批处理技...

展开>> 收起<<
多机群网格的数据负载均衡模型.doc

共63页,预览7页

还剩页未读, 继续阅读

作者:高德中 分类:高等教育资料 价格:15积分 属性:63 页 大小:568.5KB 格式:DOC 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 63
客服
关注