基于复杂网络的图书馆借阅关系网研究
VIP免费
第一章 绪论
1
第一章 绪论
§1.1 复杂网络的研究现状及其发展动态
网络可以描述现实世界中的许多关系。例如,物种之间的捕食关系,词与词
之间的语义联系,计算机之间的网络联接和网页之间的超链接,人与人之间的社
会关系,产品的生产与被生产关系,科学家或企业之间的合作关系,等等。网络
还可以作为自然界和人类社会的背景来讨论和研究各种现象。例如,计算机网络
上病毒的扩散,人接触网上传染病(如 SARS)的传播,社会关系网上信息的交流
和知识的传播,等等。此外,网络与现象的结合,还可以用来探讨网络的稳定性
等结构特性与功能的关系,例如物种捕食关系网(食物链)上个别物种或部分物
种数量的减少甚至灭绝对整个生态系统的影响和破坏性,以及诸如社会突发事件
的预报、处理和控制,电力网和交通网的优化设计等问题。网络结构本身的演化
过程也是一个值得研究的问题,例如对于某一个学科内的引文网络与科学家网络
的演化机制的研究,有可能给出促进科学发展的新的方案与模式。近年来,关于
复杂网络系统的研究正处于蓬勃发展的阶段,大量的文章发表在 Science、Nature
等国际一流的刊物上,成为学术界一个新的研究热点。
复杂网络理论的发展可以分为三个阶段:
第一阶段:规则网络理论。科学家们认为,真实系统各因素之间的关系可以
用一些规则的结构来表示。因此,对真实网络的研究也主要是借助规则图及相应
理论来完成的。规则网络的特性是平均集聚程度高而平均最短距离长。
第二阶段:随机网络理论。1959 年,匈牙利数学家 Erdös和Rényi 提出了 ER
模型[1],奠定了随机网络理论的基础,标志着对复杂网络的研究进入了第二阶段。
在ER 模型中,将网络系统视为点和边的随机集合,借助随机图理论对其进行研究。
此后 40 多年内,ER 模型一直是网络研究的基本模型。一个典型的 ER 模型是通过
给定 N(N为定值)个节点,以一定的概率
p
连接每一对节点,从而建立一个总
边数期望值为
[ ( 1) / 2]p N N
的随机网络。随机网络的特性是平均集聚程度低而平
均最短距离小,这一点和实证研究相符合。但随机网络的集聚系数远小于同样规
模的现实网络。因此,随机网络不能很好的刻画现实网络。
第三阶段:复杂网络理论。随着计算机数据处理和计算能力的飞速发展,科
学家们通过对大量真实网络的实证研究发现,存在大量的真实网络既不是规则网
基于复杂网络的图书馆借阅关系网研究
2
络,也不是随机网络,而是具有与前两者皆不同的统计特征的网络。这样一类网
络被科学家们称为复杂网络。尤其是近年来的两项开创性的研究工作,使人们对
复杂网络系统的认识发生了巨大的改变,掀起了网络研究的新高潮。
1998 年 Watts 和Strogatz 发现,只需在规则网络上稍作随机变动,就可使网络
同时具备高集聚程度和小路径长度两个性质,提出了小世界(small-world)网络模
型(WS 模型)[2]。该模型初始状态为一个节点数为 N的环形规则网络,其中每一
个节点都与它初始的 K个邻节点相连。然后,以概率
p
重新连接网络中的每一条
边,并保证没有自连边和重复边。通过改变 p,即可观察到网络从有序(规则网,
p=0)到无序(随机网,p=1)的变化过程(见图 1.1)。
小世界的概念描述了这样一个事实:在大多数的复杂网络系统中,尽管规模
很大,但在任意两个节点间有一条相当短的路径。这就是社会心理学家 Stanley
Milgram 在 1967 年提出的“六度分离”概念。他断定,在美国大多数人之间相互
认识的途径的典型长度为六。此后,Watts 等人还发现,社会网络的一个共同特征
是集团化形态,即集聚 (clustering) 现象。它表示,你的两个朋友彼此之间认识
的可能性显然比任意两个人的要大,由此结成朋友圈或熟人圈。实证研究发现,
绝大多数的现实网络都存在小世界特性。
图1.1:小世界网络拓扑结构示意图 (左边为规则网络,右边为随机网络,中间
的网络是在规则网络中加入随机因素而形成的小世界网络。)
1999 年 A.-L. Barabási 和R. Albert 等在对万维网的实证研究[3,4]中意外发现,万
维网基本是由少数高连通的页面(节点)连接起来的。这些占总数不到万分之一
的极少数节点却和 1000 个以上的节点连接,所以被称为中枢节点(Hub, hub-node),
而 80%以上的页面的连接数不到 4 个。并且,随机网络具有的多数节点大致相同的
“平均连接数”特征不见了,网络中的一个节点与其它 k 个节点相连接的概率分
布不是服从 ER 模型所描述的泊松分布,而是按一幂函数规律衰减,服从
( )p k k
第一章 绪论
3
分布,由于其缺乏一个描述问题的特征尺度而被称为“无标度(scale-free)”网络。
同时,他们还证明了,无标度网络还具有“小世界”特征。之后,许多实证研究
也证实了,大量的实际网络系统都具有“小世界”和一定范围内的无标度特征。
而且还有一个值得注意的共同点,即无标度网络的幂指数γ的值通常介于 2~4 之
间。
此外,
A.L. Barabási 和R. Albert 发现,增长和择优连接是现实网络的无标度特
性的两种演化机理,提出了 BA 模型[3]。在 BA 模型中,网络开始于少量的节点,
在其后的一定的时间间隔中,不断增加新的节点与网络中现有节点相连,现有节
点被连接的概率与该节点的度成正比。在这样的规则下演化得到的网络具有两个
重要的特征使之区别于 ER 模型和小世界模型,那就是:
(1) 增长,网络是通过不断的加入新节点而演化得到的。这和 ER 模型及小世界
模型中节点数预先固定有明显的区别。
(2) 择优连接,新节点与网络现有节点的连接概率是不均匀的,度值大的节点容
易获得新的连接。
这也解释了“中枢节点”存在的原因,也就是对随机网络理论不能进行分析
和研究,但又普遍存在的动态演化系统所显示的重要特性,“马态效应”现象(“富
者愈富”)作了解释。
图1.2:无标度网络的拓扑结构 本图例中的网络按 BA 模型生成,有 130 个
节点,节点度服从幂指数为-3 的幂律分布。
基于复杂网络的图书馆借阅关系网研究
4
图1.3:随机网络和无标度网络度分布比较示意图,图中(a)为随机网络的度分布,
(b)为无标度网络的度分布。
目前,国际上已进行的无标度网络的实证研究包括语言学,生物学,生态学,
计算机网络,社会学,以及电力,通信等领域的各种关系所构成的实际网络(见
表 1)。研究的网络类型大多数为无向网络(例如演员合作网和科学家合作网)和
有向网(例如万维网,引文网和电力网等),而对加权网络(例如科学家加权合作
网[5])和层次结构网络[6]的研究成果不多。研究的重点主要是网络的静态几何特性,
即拓扑结构、网络的演化机理和网络的动力学性质等。核心内容为网络的“小世
界”,“集聚”和“无标度”等特性的研究和分析。还有应用研究,即怎样通过对
网络系统结构的研究,找出结构和功能的关系,来解决自然界和人类社会的一些
实际问题,例如对传染病 SARS 和对计算机病毒传播的控制,对癌症等疾病的治疗,
以及生态系统的平衡,电力网和交通网的优化设计等。但是,应用研究还处于探
索阶段,成果不多。
表1.1:无标度网络研究实例
网络名称
节点
连接关系
万维网[7,8]
网页
网页中的链接
因特网[9,10]
路由器
光纤或其他物理连接
研究合作[11,12,13]
科学家
合作撰写论文
引文网[14]
论文
论文的相互引用
演员合作网[2,15]
演员
共同出演同一部电影
蛋白质调控网络[16]
协助调控细胞活动的蛋白质
蛋白质之间的相互作用
组织代谢[17]
参与消化食物以释放能量的分子
参与相同的生化反应
同时,一大批社会学家运用社会网分析方法提出了社会网上的传染病、信息、
第一章 绪论
5
时尚、新知识等的传播理论、劳动力的求职和转职的理论、组织结构的形成理论
等等。这些理论的结论都可以实证验证的。社会网络可以分为单模式网络(只有
同一类节点,称为参与者)和双模式网络(有两类不同的参与者),甚至更多模
式的网络。双模式网络中一类节点是某种活动、事件或者组织中的参与者,另一
类节点就是他们参与的活动、事件或者组织(称为项目),这种网络可以用二分
图来比较好的描述,而且在研究中常常把二分图向一类节点(常常是参与者节点)
投影。得到单模式网络,这时参与每个项目的所有参与者节点之间都连有表示在
此项目中合作关系的边,每个项目就表示为一个完全图,整个单模式网络成为完
全图的集合。
在Watts和Barabasi提出小世界特性和无标度特性后,大批学者加入到复杂网络
的研究行列中,分别在实证研究、模型演化、网络上的动力学等方面作出了大量
的研究。在Newman(2003)的综述性文章[18]系统地回顾了复杂网络的研究进展,
包括小世界效应、度分布、集群、网络相关、网络生长和偏好连接模型、以及发
生在网络上的动力学行为等概念。
国内许多学者在无标度网络模型的构造与实证研究方面作出了较大的成绩。
刘宗华等(2002)[19]认为自然界中的许多复杂网络应该介于无标度网络和随机网
络之间,并以科研合作网为例提出了一个生长模型。李翔、陈关荣(2002)[20]提
出复杂网络的局域世界模型,吴金闪、狄增如(2004)[21]提出加权网络,章忠志
等(2005)[22]针对诸如桥牌选手合作等一次合作人数固定的合作网络的特性,提
出了由完全图组合而成的一类特殊无标度合作网络的演化模型,何大韧等做了大
量的实证工作(如中国航空线路网、中国旅游线路网、北京和扬州的公交线路网、
中药方剂网、淮扬菜系网以及中国铁路轨线及车次网),并建立和研究了一些相
应的网络演化模型[23-29]。
§1.2 课题的背景及其意义
在二十一世纪初期的短短几年里,很多学科的研究者都将复杂网络理论与自
己的学科领域相联系,交叉融合,已经取得了令人瞩目的成果。以复杂性研究和
网络为基础的科学研究已经成为当前国内外研究的一个热点和极其重要且富有挑
战性的国际前沿方向。
复杂网络可以描述自然界和人类社会中很广泛的系统。经常被引述的例子包
括食物链[30]、细胞内物质反应网[31]、神经网络、WWW、Internet的架构、科学家之
间合作关系的网络[32]等等。这些数据库现在可以方便地访问、调研,借助功能强
大的计算机可以分析其结构,通过从网络的角度研究这些多种多样的系统,人们
获得了新的认识,也推动了对复杂网络系统的一般了解。
同样,图书馆也是一个很典型的复杂网络系统,一个网络系统由节点和两两
基于复杂网络的图书馆借阅关系网研究
6
节点之间可能存在的连接构成,通过图书馆借阅这样一种过程,在书籍与书籍之
间,读者与读者之间,以及书籍和读者之间建立了某种联系,从而构成了图书馆
借阅社会关系网。上海理工大学图书馆由于长期积累,具有数量庞大、类型复杂、
内容广泛、文种多样等特点,在校师生人数众多,每天的借阅量大,外借量直接
反映出读者对文献的需求状况,是衡量图书利用效益的重要指标。所以以本校图
书馆的书籍借阅情况构造网络,从复杂网络的角度对图书馆网络进行实证分析,
统计书籍的流通率、了解书籍的受欢迎程度等,这样可以有针对性的采购书籍,
使馆藏文献信息发挥最大效益。通过在复杂网络的层次研究图书馆,带给我们关
于图书馆新的信息和新的研究视角。
其次,对实际网络统计性质的实证研究是复杂网络研究的基础工作,再好的
模型也要有实证数据的支持,虽然研究者们对众多社会网络做了大量的实证工作,
但关于图书馆借阅关系网的实证研究几乎没有。
§1.3 论文的主要研究内容
如上所述,随着高校图书馆在高校教学中的作用越来越大,越来越多的学生
已不满足于课堂的学习内容,通过业余时间在图书馆借阅书籍来扩充自己对知识
的求知欲望,如此图书馆借阅社会关系网也随之无限扩大,面对这样一个大网络,
传统的研究方法已无能为力,无法透彻地去解析这个网络的特性。而复杂网络理
论则是描述和处理这类网络的有力工具,也为图书馆情报学工作者提供一个全新
的研究视角。
本文的主要工作就是借助复杂网络的有关理论,来描述图书馆借阅社会关系
网,通过收集到的上海理工大学图书馆流通部一年时间内的书籍借阅状况的真实
数据,构造图书馆借阅关系网的二部图以及投影得到的单模式网络,统计图书馆
借阅社会关系网的特征属性,分析网络的结构特征,构建图书馆借阅关系网的演
化模型,借助计算机仿真技术来研究网络的动态特性,并通过实证来验证所构建
模型的合理性,最终达到解释现实现象,优化现实网络结构,提高网络效率的目
的。最后,为加强图书馆馆藏书籍利用效率、采购新书和更好的成为高校的知识
学习的组织管理者提出一些建议。
论文的主要研究内容包括:
(1)图书馆借阅关系网的实证研究。从二部图的项目含顶点数、顶点项目度分布,
单模式网络的节点度分布、群聚系数及其相关性、平均最短路径、度协调性
与同类匹配系数等相关网络统计属性入手,对图书馆借阅关系网的结构进行
摘要:
展开>>
收起<<
第一章绪论1第一章绪论§1.1复杂网络的研究现状及其发展动态网络可以描述现实世界中的许多关系。例如,物种之间的捕食关系,词与词之间的语义联系,计算机之间的网络联接和网页之间的超链接,人与人之间的社会关系,产品的生产与被生产关系,科学家或企业之间的合作关系,等等。网络还可以作为自然界和人类社会的背景来讨论和研究各种现象。例如,计算机网络上病毒的扩散,人接触网上传染病(如SARS)的传播,社会关系网上信息的交流和知识的传播,等等。此外,网络与现象的结合,还可以用来探讨网络的稳定性等结构特性与功能的关系,例如物种捕食关系网(食物链)上个别物种或部分物种数量的减少甚至灭绝对整个生态系统的影响和破坏性,...
相关推荐
作者:陈辉
分类:高等教育资料
价格:15积分
属性:64 页
大小:1.66MB
格式:PDF
时间:2024-11-19