结构化P2P环境中基于内容的图像检索若干关键技术的研究与探索

VIP免费
3.0 牛悦 2024-11-19 4 4 1.9MB 54 页 15积分
侵权投诉
I
摘 要
近几年来,随着多媒体技术、网络技术和信息数字化处理的高速发展,产生
了多种多样的图像数据,同时计算机能够处理的图像数据范围也日益增大。伴随
着图像检索的发展,基于内容的图像检(Content-based Image Retrieval,简称
CBIR )也变成了研究热点之一。
本文对结构化 P2P 环境下基于内容的图像检索关键技术和聚类策略进行了深
入的研究,从基于内容的图像检索和结构化 P2P 网络两方面进行探讨。首先,对
基于内容的图像检索的工作流程和关键技术进行了总结阐述,并结合本文需要,
在基于内容的图像检索系统中将颜色与纹理相结合进行特征提取,并使用一种简
单的降维方法。然后,从网络的拓扑结构、基于 DHT 的网络搜索方法以及聚类方
法三方面对结构化 P2P 做了介绍,并提出一种协议无关的拓扑匹配算法。
为了在结构化 P2P 网络中进行基于内容的图像检索,如何将模糊查找用于结
构化 P2P 成为了本文的主要问题。本文提出一个通过超级节P2P 络进行基于
内容的图像检索的系统,对图像进行半模糊聚类,超级节点覆盖网的路由搜索算
法类似于 CAN。并对该网络进行了模拟与分析,实验表明该网络具有良好的扩展
性,并且节点需要维护的状态量与网络规模(节点数目)无关。
最后简单实现了 CBIR 系统,该系统能有效检索出所需图像。
关键词:基于内容的图像检索 结构化 P2P 聚类 超级节点
II
ABSTRACT
In recent years, as the rapid development of the multimedia technology, network
technology and digital information processing, it produced a variety of image data. At
the same time, the range of image that computer can handle the data has expanded
quickly. Along with the development of Image Retrieval, Content-based Image
Retrieval (CBIR) has become one of the hotspot.
In this paper, we research the structural P2P environment content-based image
retrieval key technology and clustering strategy, from content-based image retrieval and
structured P2P network two aspects. First of all, working process and key technology of
Content-based Image Retrieval are summarized and elaborated. According to the need,
it will combine with the color and texture for feature extraction and use a simple
dimension reduction method in Content-based Image Retrieval system. And then, from
the network topology structure, based on DHT the structural P2P networks search and
clustering method three aspects structured P2P is introducedand this paper proposed a
protocol-independent topology matching method.
In order to apply content-based image retrieval in the structural P2P networks, how
to fuzzy search in the structural P2P networks become the main problems. We retrieve
images based on their contents over a super-peer P2P network, to do semi-fuzzy
clustering for image, structured SP overlay routing search algorithm similar to CAN.
According to the simulation and analysis of the network, the experiment indicated that
the network has good expansibility and the state quantity of node’s maintenance is
independent of network scale (node number).
Finally Simple to realize the CBIR system, it can effectively retrieval the needed
image.
Keywords: Content-Based Image Retrieval, Structured P2P,
Clustering, Super Peer
III
目录
中文摘要
ABSTRACT
第一章 绪论 .....................................................................................................................1
§1.1 课题研究的目的和意义 ....................................................................................1
§1.2 CBIR 的现状与研究方向 ................................................................................. 1
§1.3 P2P 的现状与研究方向 .................................................................................... 2
§1.4 本文工作及各章节安排 ....................................................................................3
第二章 基于内容的图像检索的工作流程和关键技术 .................................................4
§2.1 基于内容的图像检索(CBIR)的工作流程 ........................................................4
§2.2 图像特征及其提取 ............................................................................................4
§2.2.1 颜色特征及其提取 .................................................................................4
§2.2.2 纹理特征及其提取 ................................................................................6
§2.2.3 形状特征及其提取 ................................................................................8
§2.3 特征匹配 ............................................................................................................9
§2.3.1 基于距离函数的相似性度量方法 ........................................................9
§2.3.2 非几何的相似性度量方法 ..................................................................10
§2.4 相关反馈技术 ..................................................................................................10
§2.4.1 查询向量转移 .......................................................................................11
§2.4.2 权重系数调整 .......................................................................................11
§2.4.3 基于机器学习理论 ...............................................................................11
第三章 结构化 P2P 网络 .............................................................................................. 13
§3.1 P2P 的定义与分类 .......................................................................................... 13
§3.1.1 P2P 的定义 ........................................................................................... 13
§3.1.2 P2P 的分类 ........................................................................................... 13
§3.2 结构化 P2P 网络的拓扑结构及其改进 ......................................................... 14
§3.2.1 拓扑结构的定义 ...................................................................................14
§3.2.2 典型的结构化 P2P 拓扑算法 .............................................................. 14
§3.2.3 本文提出的拓扑匹配算法 ...................................................................15
§3.3 基于 DHT 的结构化 P2P 网络中的文件搜索 ...............................................19
§3.4 常见的聚类策略 .............................................................................................23
§3.4.1 等级聚类法(hierarchical Clustering methods) ....................................24
IV
§3.4.2 划分聚类法(partitioning Clustering methods) .................................... 25
§3.4.3 启发式聚类法(Heuristic Clustering Methods.............................. 27
§3.4.4 基于密度的聚类方法 (density-based Clustering methods) ...............27
§3.4.5 基于网格的聚类方法 (grid-based Clustering methods) ....................28
§3.4.6 基于模型的聚类方法(model-based methods) .................................... 28
第四章 结构化 P2P 中基于内容的图像检索的关键技术 .......................................... 30
§4.1 特征提取和降维 ..............................................................................................30
§4.2 半模糊聚类算法 ..............................................................................................31
§4.3 球状簇的选择 ..................................................................................................32
§4.4 相似性度量与排序 .........................................................................................33
§4.5 数据结构 .........................................................................................................34
§4.6 超级节点网络 .................................................................................................35
第五章 系统的实现与分析 ...........................................................................................41
5.1 实验的参数设置 ................................................................................................41
5.2 网络的性能分析 ................................................................................................43
5.2.1 储存需求 .................................................................................................43
5.2.2 超级节点更新的成本 .............................................................................43
5.3 图像的查询精度与回馈 ....................................................................................44
结论 .................................................................................................................................46
参考文献 .........................................................................................................................47
在读期间公开发表的论文和承担科研项目及取得成果 .............................................51
...............................................................................................................................52
第一章 绪论
1
第一章 绪论
§1.1 课题研究的目的和意义
近几年来,随着多媒体技术、网络技术和信息数字化处理的高速发展,产生
了多种多样的图像数据,同时计算机能够处理的图像数据范围也日益增大。面对
越来越多的图像信息,如何自动地、智能化地检索、查询和管理图像,实现快速、
准确的查找,已成为国内外多媒体检索研究的热点之一。
从上世纪七十年代,已经有人对图像检索进行研究,当时大多是基于文本的
图像检索技术Text-based Image Retrieval简称 TBIR利用文本描述图像的特
征,这就要求用户对文本特征的描述要准确和规范。但图像内容具有丰富的内涵,
再加上人们对图像内容的描述带有主观性,很难用关键字描述图像的视觉特征。
因此,TBIR 不能准确地描述图像内容的多样性。
到九十年代以后,出现了对图像内容定义与检索的相关技术,也就是基于内
容的图像检索Content-based Image Retrieval,简CBIR技术CBIR直接根据
描述媒体对象内容的各种特征如图像的颜色、纹理、形状等进行分析和检索,从
而在图像数据库中查找到包含某个特征的图像。它与的其它多种图像技术相融合,
满足了用户对图像据进行语义分析、表达和特征检索的要求。
CBIR的主要特点如下:l.图像的信息直接从图像的内容里提取;2.图像检索通
常是精确检索,而CBIR是相似检索;3.不需要人工进行提取特征与建立索引,可
由计算机完成,大大减少了工作量,也避免了人工描述的主观性;4.基于内容的图
像检索是一个逐渐逼近与相关反馈的过程。
目前,CBIR技术使得图像检索更加的直观与客观,是个非常活跃的研究课题。
它将广泛应用于信息检索服务(譬如对外观设计专利图像进行检索用于知识产权
保护)、犯罪预防(譬如利用不良敏感图片的相似特征便可以使它们无处藏身)
医疗诊断(在临床决策过程中,根据图像数据库中的某些疾病的具体特征,对相
关图像进行检测,更甚者可通过基于图像的推理过程协助医生诊断)、教育培训
和军事等各个领域。总的来说,CBIR技术是一个非常有前景的研究方向,而且它
的深入研究定会带着其它相关领域一起发展。
§1.2 CBIR 的现状与研究方向
CBIR技术已经发展了十几年,由于涉及模式识别、图像理解、计算机视觉等
领域,已成为国外的研究热点之一。很多研究组织先后推出了各自的系统,最早
结构化 P2P 环境中基于内容的图像检索若干关键技术的研究与探索
2
成功应用CBIR技术的是IBMQBIC系统,这个系统是为一个俄国博物馆制作的绘
画作品查询系统。除了IBMQBIC系统之外,比较著名的系统还包括UIUC大学的
MARS 系 统 MIT Photobook UC Berkeley Digital Library Project ,以及
Columbia大学的VisualSEEk等。
刚开始基于内容的图像检索研究主要集中在描述图像内容时用什么样的全局
特征,图像匹配时用什么样的相似度量。
后来,先对图像进行分割,提取出其中的物体,然后用局部特征描述每一个
区域,再将每个局部特征结合进行对图像的整体特征描述,检索图像时用某种固
定标准进行相似度量,这就是基于区域的图像检索方法(Region-based image
retrieval)
随着互联网的发展图像数量越来越多,怎样提高检索速度成为了图像检索的
另一个研究热点。于是出现了高维索引技术,它包括两方面:一是图像高维特征
的降维技术,主要方法有按列聚类和Karhunen-Loeve变换;二是图像高维特征索引
技术,主要有聚类技术、R树、使用自组织神经网络构造树状索引结构等。目前,
虽然关于这个领域的研究已获得了一些成果,但探索更好的高维索引技术仍然是
非常有意义的研究方向。
相关反馈技术是另一个研究热点。相关反馈是系统首先按照一开始输入的查
询条件进行查询并将初步的查询结果反馈给查询者,查询者从中选出几个与其查
询意图最相关的(正反馈),或者选择几个与其查询意图最不相关的(负反馈)
系统然后根据查询者反馈的这些信息更新上一次的查询条件,再一次进行查询,
重复这个步骤,使以后的返回结果更贴近查询者的真实意图。相关反馈主要根据
查询者的需求不停地调整检索时所用的特征向量或者多个特征的权数,使得反馈
更加接近查询意图,进而提高检索的效果。
§1.3 P2P 的现状与研究方向
完全分散的对等网络已被使用了很久,1979年开始使用的Usenet1984年开
始使用的FidoNet。二十世纪九十年代末期,在即时通信广泛应用前,为了促进对
等网络应用的发展,升阳 (SUN)公司为了方便开放分散的即时聊天的applet和应用,
增加了一些类到Java技术中。这个工作现在被JXTA工程来接手完成。P2P系统和应
用引起了许多计算机科学研究者的关注,一些突出的研究计划有Chord
, ARPANETthe PAST storage utilityP-Grid(一个自发组织的新兴覆盖性网
络),和CoopNet内容分发系统。到了2000,使用P2P技术的软件比比皆是,如
MSNQQeMuleOPENEXT迅雷Thunder易载ezpeerKuro M3 Kuro酷狗、
摘要:

I摘要近几年来,随着多媒体技术、网络技术和信息数字化处理的高速发展,产生了多种多样的图像数据,同时计算机能够处理的图像数据范围也日益增大。伴随着图像检索的发展,基于内容的图像检索(Content-basedImageRetrieval,简称CBIR)也变成了研究热点之一。本文对结构化P2P环境下基于内容的图像检索关键技术和聚类策略进行了深入的研究,从基于内容的图像检索和结构化P2P网络两方面进行探讨。首先,对基于内容的图像检索的工作流程和关键技术进行了总结阐述,并结合本文需要,在基于内容的图像检索系统中将颜色与纹理相结合进行特征提取,并使用一种简单的降维方法。然后,从网络的拓扑结构、基于DHT...

展开>> 收起<<
结构化P2P环境中基于内容的图像检索若干关键技术的研究与探索.pdf

共54页,预览6页

还剩页未读, 继续阅读

作者:牛悦 分类:高等教育资料 价格:15积分 属性:54 页 大小:1.9MB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 54
客服
关注