基于模糊聚类的集群研究和实现

VIP免费
3.0 高德中 2024-11-19 5 4 540.21KB 56 页 15积分
侵权投诉
摘 要
随着 Internet 的发展,出现了大量计算机在绝大多数时间都是空闲的情况,
这是巨大的浪费,如何减少这样的浪费,充分利用现有的计算机资源是我们追
的目标。而有效地组织现有的计算机是比较困难的,网络技术为此提供了一个
好的方法。多集群网络是利用现有局域网内的计算机,把这些计算机划分组成
个并行装置。由于每个节点计算机的计算能力不同,如何有效的组织这些计算
是个难点。本文利用模糊聚类的方法,研究多个计算机计算节点聚类,同时研
负载平衡问题,使最后的聚类结果很好的实现负载平衡。
在多个计算机构成的网格环境下,为了提高多机群网格的异构资源的利用
提出了一个数据负载均衡模型。该模型涉及的关键技术包括TCP/IP 协议,Java
多线程技术,Socket 通信技术行程序设计技术,计算机集群及基于消息传递
的并行程序编程技术,模糊数学等。
在多个计算机构成的网格环境下,为了提高多机群网格的异构资源的利用
提出了一个基于模糊聚类的集群模型。研究的工作主要包括1.构建异构的计
机集群。2.确定计算机的评价参数,主要根据计算机的计算能力,存储能力,
信能力,网络性能等因素来表示计算机的综合性能,再按照该综合性能划分计
机集群,从而实现计算机集群内的计算机的综合性能相近,进而达到动态负载
衡的目的。3.模糊聚类算法:应用模糊数学中的模糊相似矩阵理论对计算机分
并在计算各个计算机的隶属度的过程中,创新的提到利用对计算机各个属性的
值来影响聚类,从而使聚类更加灵活的适应于最后的并行任务。4.针对聚类的结
果进行相关试验以及相关分析。
关键词:计算机集群 模糊聚类 负载平衡 并行计算
ABSTRACT
With broad development of Internet, the most computers are idle on most time. Our
aim is to end the obvious and tremendous waste. So how to manage and use it
effectually is an important task for people. Network technology provides strong support
for parallel computing . Utilizing mutiple computer clusters to construct mutiple
clusters grid which actualize parallel computing is an effective approach. And then it is
a tough problem how to apart and management them. The paper gives a way to solve it,
whose main purpose is to separate the computers into different groups in which the
computers are the most similar by the calculating following the Fuzzy theory. The value
of the weighted value is modifiable, which following the characters of the computer can
affect the Fuzzy set as you want.Because of heterogeneous characteristic of node of
mutiple clusters,its capability imbalance,it makes more difficult to realize parallel
computing. Load balancing is one of hot research questions.
To improve heterogeneous resource’s using efficiency in multi-cluster grid that is
constructed by multi-computers,a data load balance model based Fuzzy is proposed.The
key technology about the model are including TCP/IP protocol, multiple thread
technology, Socket communication technology, Parallel Computing , Cluster and
MPI(Message Passing Interface),and Fuzzy Mathematics and so on.
Research work are including as follows: 1. The construction of the Clusters which
contains heterogeneous computers. 2.Find out the characters of the computer in which
how to describe the computer. The evaluating parameters are fixed on which are used to
computing ,storage and communication, the net which the computer belong to, then the
cluster partition is in accordance with the integrative capability, and the purpose of load
balance can be achieved. 3. Fuzzy Cluster Algorithm: the partition of the cluster follow
the Principle of Fuzzy Similarity Matrix. The algorithm take in the weigh following
each character to mark the different value when to calculate the degree of the similarity
of the computers. 4.The experimens are about the algorithm and the interrelated
analyses.
Key WordCluster , Fuzzy , Load Balancing , Parallel Computing
目 录
摘要
ABSTRACT
第一章 绪论.....................................................................................................................1
第二章 相关技术概述.....................................................................................................4
§2.1 可扩展的并行计算机体系结构.......................................................................4
§2.2 机群技术...........................................................................................................7
§2.3 网格技术...........................................................................................................9
§2.4 负载平衡.........................................................................................................12
§2.5 并行计算.........................................................................................................13
第三章 主要关键技术...................................................................................................17
§3.1 TCP/IP 协议....................................................................................................................17
§3.2 多线程技术.....................................................................................................19
§3.3 Socket 通信技术.............................................................................................22
§3.4 MPI..................................................................................................................26
§3.4.1 MPI 简介..............................................................................................26
§3.4.2 MPI 核心函数......................................................................................27
第四章 模糊聚类算法及实现.......................................................................................32
§4.1 模糊聚类算法.................................................................................................32
§4.1.1 算法相关背景.......................................................................................32
§4.1.2 数学模型...............................................................................................32
§4.1.3 算法有效性证明.................................................................................................32
§4.2 模糊聚类的算法实现.....................................................................................39
§4.2.1 类的设计及函数说明...........................................................................39
§4.2.2 代码实现...............................................................................................40
§4.3 模拟实验.........................................................................................................................50
第五章 试验及其分析...................................................................................................53
§5.1 试验环境.........................................................................................................53
§5.2 试验步骤.........................................................................................................53
§5.2.1 聚类计算机...........................................................................................53
§5.2.2 分配任务...............................................................................................54
§5.3 实验结果..........................................................................................................................55
第六章 束语...............................................................................................................62
.........................................................................................................................63
第一章 绪论
第一章 绪论
现实情况中,绝大多数时间空闲的,了计算能力的很大浪费
Windows 下用任务器或Linux 的工具(例 topxload)观
CPU会看CPU 的使用率常见在 12%,如果有更多的计算机,这
,在一个有 300 台计算机的部门里CPU 的空闲率是惊人的。而这些
门还大的用来译或模拟计算,这样的情况还会,不
,因为随着用加,使8CPU 不能把任务
交给另外的空因为改变习惯去登陆另台服。如
能利用现有的计算资源,把空闲CPU 利用来,或者器智能的迁移
,这是一心的[1][2]
随着行时代辉煌夕阳,不久就会迎来并行时代的朝霞[1][2]随着社会的进
步,活方改变们对计算能力的要求空何发展,
乎摩尔律也从理论达到了极限[3][10],这似对于我们对计算能力的永远
望尘。而大计算能力的的平民化,似的巨
高成本计算机也只梅止这样计算能力
价格的优势容易的实现的计算。这好是计算机集群的[1]
[2]
20 世纪 80 年代,出现了三种趋势,集群计算才获得了发展的动力,这
种趋:高性能网络性能算机的标
第四个可能的发展趋势是对计算能力求的何数量的大,于计
和商用的计算,对于传超级计算机来说是高成低收。随着现代技
术的发展计算机部件商品化,集群系统(PC 机,工作站或共享存储多
器 SMP 构成成为价格合理吸引并行计算并行计算由使用传
超级计算机平,如 Cray\SCI T3E转向了使通用目的的以单处
器或PC 工作部件松耦合的集群系。这种趋势有很多好
包括可以按照定任务建立承担大型主页和负载的计算机平[1][2]
突破单机计算能力的一个根本是实现并行计算[1-4]纪 90
代以来,并行计算以空飞速发展,一,由机的计算
提高,并行计算机的体系结,数据传络的化和
,使并行计算机的制周几年为研并行计算
了有并行计算发展的主要动力来际上
一些要研究计划。如美国 HPCC 计划,美国 ASCI 计划。,高性能大模并行
计算机费用高成本高,一难以承受,而机群[5-7]计算可以提供高性价比的
高性能计算务。型的机群系曙光 2000/3000 , IBM SP 列,Beowulf
群等。网格[8-11]( Grid) 是利用高速国际互联或专用网络把地球上广泛的计
算资源存储资源通信资源网络资源软件资源数据资源信息资源知识资源
成一辑整, 现用在网格这拟组织环进行资源共享
协同工作消信息孤岛和资源孤岛
现在正处于集群的黄金发展阶段一些有影响力的集群模型,各有
,有的对应于特殊任务,有的有很好的扩展性,有的负载平衡很好[1][2]这样,
逐渐会形成比健全的集群,而如何划分集群[7][16][17]也就是根据计算机
一些算机使载平[1][2]
1
基于模糊聚类的集群研究实现
等一些问题更,在这方面还比较方法,这是根据一些计
算机的些属性计算任务的点来寻找使集群的划分得尽学的方法。
最近几年,网格技术成究的,其异构资源的能力,
我们构建异构集群来了新的理论技术支撑由于 INTRANET 上的计算机的 CPU、
内存磁盘网络参数[3][10]各不相同,以简地把在一构成的系
是集群。必须们进行聚类划分,成不同计算类型逻辑计算机集群[1][2]
后分配计算任务。为了有效的划分集群,我们提出了基于模糊聚类的集群模型
(Fuzzy-based Cluster Model)
源构成计算装置有现实意义
随着计算机集群技术的广泛应用,模并行计算现在社会的各个域。
因而如何有效效的计算这些计算机集群是一个
务。网格计算[12-16]为并行计算提供了有力的支持利用多个计算机机群[17-18]构建
多机群网格来实现并行计算是一个有效的由于多机群的节点有异
能力的不均衡性,使并行计算现比较困难。其中负载平衡问题是一个研
究的点。有关负载平衡的文[19-23]有很多。[19]提出一个分布式数计算的负载
分配。在分计算中, 计算程序常需要在多计算机, 其中每
算机成一, 们相合作体计算任务。算任
均分配各个节点计算机网格时MPICH2 的默认分配任务方法, 会引起某
性能的计算机的计算任务过载, 从而影响个集群网格的理能力理能力
针对这一实问题, 分析了分布式平行程序的点以及现有负载理方法,
了问题的划模型, 提出了基于模糊聚类的分布式负载分配策略
该模型利用模糊数学中的模糊相似矩理对计算机聚类,计算机的数学
型用<k1,k2,k3,k4,k5>其中 ki为计算机属性,在聚类过程中的任个计
算机的隶属度的计算中,均个属性的权值,权值是由最后的并行计算
机任出,使隶属度的计算更加关些属性,而使最后的聚
这些属性,这些属最后计算并行任务时的最关键属性,而使并行计算任务
到最高的效率。在聚类过程中,对应模糊相似矩阵的聚最后
并行任务定,而使聚类更加合理并行任务的计算要求。在聚
个聚类分配任务的策略可根据各个聚类的平均计算能力分配任务,这个评
应该根据体的并行任务定量最后的分配函后,体分
并行任务,后计算了。
最后文中对于该分了试验相应的结果及其试验分析。试验表明在
复杂网络情况下的计算机在计算并行计算任务时应合理划分,而于模
聚类的划分是效划分。该模型充到负载平衡的各个便
根据并行计算任务的分,从而在划分集群时有更好的灵活性,可
成根体计算问题的定量分配体分使用者给出。该模
出了模型的一形式体的参数可以的使用时出,
好的动态性可扩展性。
2
第二章 相关技术概述
第二章 相关技术概述
§2.1 可扩展的并行计算机体系结构
并行计算机随发展已经了一个新时代。目行计
机的性能已经接近100TFLOPS,1000TFLOPS 的并行计算机中。
根据指令流数据的不同,通把计算机系分为四类:
指令流数据(SISD指令流多数据( SIMD
指令流数据(MISD指令流多数据( MIMD
并行计算机系统除少量用的SIMD统外,绝大分为MIMD
要的并行计算机系有 五 :并行量 机 ( PVPParallel Vector
ProcessorSMP,Symmetric Multiprocessor模并行
MPPMassively Parallel Processor机群Cluster
存储多理机DSMDistributied Shared Memory)这五类计算机系代表
当今世界并行计算机的主要体系结构。简一下SMP、DSM、MPP
理机系统SMP
2.1是对理机系的简结构,线或交
、共享内存以及I/O 等组成。
Error: Reference source not found
2.1 理机系
SMP具有如下
访
I/O的I/O访问的延迟带宽访问成率是一的。
内存的地编码的,各个的地相同作系
行在任一个理机
一的作系映像一个作系驻留中,
根据各个理机的负载情况,动态分配各个机的负载,并理机
负载平衡。
存及其数据一:每理机均有
的局数据,是这些数据必须保持与存储中的数据是一的。
:各个进程根据作系/
CPU
Cache
he
线 或交
Memory Memory
CPU
Cache
he
CPU
Cache
he
I/O
...
...
3
摘要:

摘要随着Internet的发展,出现了大量计算机在绝大多数时间都是空闲的情况,这是巨大的浪费,如何减少这样的浪费,充分利用现有的计算机资源是我们追求的目标。而有效地组织现有的计算机是比较困难的,网络技术为此提供了一个很好的方法。多集群网络是利用现有局域网内的计算机,把这些计算机划分组成多个并行装置。由于每个节点计算机的计算能力不同,如何有效的组织这些计算机是个难点。本文利用模糊聚类的方法,研究多个计算机计算节点聚类,同时研究负载平衡问题,使最后的聚类结果很好的实现负载平衡。在多个计算机构成的网格环境下,为了提高多机群网格的异构资源的利用率,提出了一个数据负载均衡模型。该模型涉及的关键技术包括:...

展开>> 收起<<
基于模糊聚类的集群研究和实现.doc

共56页,预览6页

还剩页未读, 继续阅读

作者:高德中 分类:高等教育资料 价格:15积分 属性:56 页 大小:540.21KB 格式:DOC 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 56
客服
关注