基于复杂网络的商铺链接合作网的研究

VIP免费
3.0 陈辉 2024-11-19 5 4 1.97MB 64 页 15积分
侵权投诉
摘 要
近年来,电子商务作为一种新兴的商务模式,广泛的在网络上流行起来。我
们研究的淘宝网是电子商务中的代表网站。众所周知,淘宝网的店家通过相互的
友情链接,形成了一个巨大的虚拟网络。由于开店的店主越来越多,这个网的规
模越来越大,普通的分析方法受到了局限,我们便可以运用复杂网络的思想来分
析一下。
以往对于电子商务网站的分析,基本都是以对网上用户的调查和网络运营方
式为主,本文从存在网络店铺间的联系为切入点,通过对其系统的结构特征,网
络的演化方式,以及加权网络的特征,对电子商务网进行了系统的分析和阐述。
首先本文通过编写网络机器人对现有的淘宝网的数据搜集,构建了一个由
128586 个店铺和 818219 条店铺间的超链接边组成的有向复杂网络-商铺链接合作
网。经研究分析发现淘宝网中的店铺以自组织连接的方式构成了一个复杂有向网
络,本网络所有节点具有出连接边,大部分结点具有入连接边,节点度分布呈指
数分布。然后开始进行模型的演化,提出了老节点随机链接,新节点择优链接的
连接方式,模拟出比较接近已有网络结构的图形。最后把信用度作为权值为网络
赋权得到的点权网络的分布是对数分布的。同时我们发现平均信用度与度的在一
定程度下线性联系也能给店主的开店带来启发。并对未来电子商务的链接网络的
发展做出了展望。
本文研究的网络是受出度限制的复杂网络,以前的复杂网络都是开放的无限
制出度的,而在现实生活中的很多社会网络如 qq 好友网,博客链接网等等都属于
受出度限制的网络,也为其他学者研究此类网络做了一个参考。
关键词:电子商务 复杂有向网络 指数分度 演化模型 加权网络
信用度
ABSTRACT
Recently, electronic commerce as a new form of business is more popular on the
internet. The taobao website which is the most successful website will give us more
typical information. As we all know, in order to publicize themselves, the shop’s owners
will exchange their friendly links. We can image that the more owners participate in the
huge net the more problems we have to face to. It’s difficult to use the traditional
method to resolve the problems. Luckly, a new method called “complex network” could
help us, in this way, we could know more from the virtual net linked so many shops.
The former scholars used the market research analysis and the operation of
electronic commerce to study the electronic commerce. But we find a new point to
analyze the whole links of the network. In this view point, we can get the construction,
evolving models and the weighted complex network to describe the complex system.
By searching the documents of the domain name www.shop*.taobao.com on the
internet from a program called “Crawl Robert”, this paper sets up a complex directed
network constructed by 128586 web shops with 818219 URLs. These shops constitute a
complex directed network by self-organization. All the vertices have outgoing links, and
most of vertices have incoming links. The vertex distribution is a index-law distribution.
After using credit as weight-value of the weighted network, we find that the resulting
distribution is a logarithmic law. Then we imitate a model based on the rules of new
nodes pick on rich and old nodes connect randomly. Useful information is given by the
linear relation between average credits and degrees. And the results we have got can
also enlighten the owners of the shops to use the most effective way to publicize their
shops. Besides, further studies on development of the links and the credits are
discussed.
Key words: electronic commerce, weighted network, credit, complex
directed network, index-law distribution, evolving model
目 录
中文摘要
ABSTRACT
第一章 绪 论 ....................................................... 1
§1.1 选题背景 ................................................... 1
§1.2 选题意义 ................................................... 2
§1.3 现实世界网络的研究成果 ...................................... 3
§1.4 本文所做的工作 ............................................. 7
第二章 复杂网络理论及其数字特征 ..................................... 8
§2.1 复杂网络理论概述 ............................................ 8
§2.2 数学模型 .................................................... 9
§2.2.1 ER 随机图模型 ......................................... 9
§2.2.2 小世界网络模型 ........................................ 9
§2.2.3 无标度网络模型 ....................................... 10
§2.2.4 局部演化网络模型 ..................................... 11
§2.3 复杂网络的数字特征 ........................................ 11
§2.3.1 网络拓扑结构 ......................................... 11
§2.3.2 顶点度分布 ........................................... 12
§2.3.3 平均最短路径长度 ..................................... 13
§2.3.4 传递性或群聚属性 ..................................... 13
§2.3.5 介数 ................................................. 14
§2.3.6 无标度测度
)(gS
...................................... 15
§2.4 本章小结 .................................................. 16
第三章 商铺链接合作网的实证研究 ..................................... 16
§3.1 商铺链接合作网的描述 ...................................... 16
§3.2 店铺链接合作网的总体概况 .................................. 17
§3.3 商铺链接合作网的网络属性 .................................. 18
§3.3.1 度分布 ............................................... 18
§3.3.2 联合度分布 ........................................... 19
§3.3.3 平均最短路长度 ....................................... 20
§3.3.4 网络的群聚系数 ....................................... 21
§3.3.5 无标度测度
)(gS
...................................... 21
第四章 生成模型 ..................................................... 23
§4.1 引言 ....................................................... 23
§4.2 生长模型简介 .............................................. 23
§4.3 早期的网络生成模型 ........................................ 23
§4.3.1 Price 引文网络模型 ................................... 23
§4.3.2 Barabasi-Albert 无向网络模型 ......................... 25
§4.4 Web 网络模型 ............................................... 26
§4.4.1 Kumar 模型 ........................................... 27
§4.4.2 William Aiello 的 3 种有向网络模型 .................... 28
§4.5 商铺链接合作网网络生成增长模型 ............................ 31
§4.6 演化流程图 ................................................ 32
§4.7 网络演化前我们对模型的相关参数设定 ........................ 33
§4.8 同等规模的演化模型与实际网络比较 ....................... ...34
第五章 加权商铺链接合作网 ........................................... 35
§5.1 引言 ....................................................... 35
§5.2 加权网络的统计性质 ........................................ 36
§5.2.1 边权的赋予方式 ....................................... 36
§5.2.2 加权网络上的统计量 ................................... 36
§5.2.3 商铺链接合作加权网 ................................... 38
§5.2.4 加权商铺链接合作网的应用研究 ......................... 40
第六章 结束语 ...................................................... 43
§6.1 论文的总结 ................................................. 43
.............................................................. 44
§7.1 软件功能说明 .............................................. 44
§7.2 主程序源代码 .............................................. 44
§7.2.1 网络数据的抓取 .......................................... 44
§7.2.2 网络数据的记录 .......................................... 48
§7.2.3 数据的对已有程序的合理转化 ............................... 50
§7.2.4 加权网络的算法 ........................................... 54
§7.3 搜集的数据格式 ............................................ 57
参考文献 ............................................................ 58
在读期间公开发表的论文和承担科研项目及取得成果 ...................... 61
.............................................................. 62
第一章 绪 论
1
第一章 绪 论
§1.1 选题背景
自从 1998 年 Watts 和 Wtrongats 提出小世界网络模型和 Barabasi 与 Albert
研究的无标度特性的被揭示,开辟了人类对于复杂网络系统认识的新天地,激
了包括物理学、社会学、经济学、计算机通信等多领域学者对复杂网络的研究兴
趣,掀起了其在不同学科的研究热潮。大量关于复杂网络的文章发表在 Science、
Nature、PRL、PNAS 等国际一流的刊物上,从一个侧面反映了复杂网络已经成为国
际学术界一个新兴的研究热点。复杂网络的研究之所以能受到不同学科的广泛关
注,其原因有以下几点:
(1)计算机技术的迅猛发展是我们能够获得比以往更多更真实的网络数据供
我们分析使用以及研究;
(2)实证分析表明,从万维网到科学家引用网再到生物神经网络,很多复杂的
网络现象展示了一些共有的规律,如幂率分布等等。
(3)理论在近几年的也取得较大突破,把复杂网络理论、动力系统理论和现代
控制理论三种科学理论有机地结合起来,探索现实复杂网络的演化过程,尤其是
深入地探讨现实中复杂网络的时空演化规律,以达到对现实复杂网络进行有效分
析与控制的目的。
因而,对网络复杂性问题从实证和理论两方面进行研究与分析,以及开展网
络拓扑结构对其动力学行为影响的研究,是一项极其重要而又富有挑战性的科研
课题,被认为是 21 世纪科学技术前沿战略性研究课题之一。
我们把网络不依赖于节点的具体位置和边的具体形态就能表现出来的性质叫
做网络的拓扑性质,相应的结构叫做网络的拓扑结构。那么,什么样的拓扑结构
比较适合用来描述真实的系统呢?两百多年来,对这个问题的研究经历了三个阶
段。在最初的一百多年里,科学家们认为真实系统各因素之间的关系可以用一些
规则的结构表示,例如二维平面上的欧几里德格网;从20世纪50年代末到90年代
末的近四十年里,无明确设计原则的大规模网络主要用简单而易于被多数人接受
一种拓扑结构——ER随机网络来描述。直到最近几年,由于计算机数据处理和运
算能力的飞速发展,科学家们发现大量的真实网络既不是规则网络,也不是随机
网络,而是具有与前两者皆不同的统计特征的网络。这样的一些网络被科学家们
叫做复杂网络。
新的研究热潮首先源起于 1998 年 Watts 和 Strogatz 的小世界网络模型[6]
模型刻画了实际网络高集聚和短的平均距离两大特性。时隔一年后,Barabási 和
基于复杂网络的商铺链接合作网的研究
2
Albert 发现大量实际网络具有高度的自组织特性,其节点度分布服幂律分布,
于幂函数具有标度不变性,因此这类网络又被称为无标度网络。Barabási 和 Albert
给出了构造无标度网络的演化模型(BA 模型)并利用平均场的理论计算了节点度
分布的幂指数。
研究网络拓扑的构成有着不同寻常的重要意义。近年来,复杂网络取得进展
的方面主要集中在生物、医学、社会学等领域。利用概率的方法汲取随机生长网
络的各种宏观性质,从而达到认识真实网络的目的。另外研究对实际有着重要的
指导意义。由于通信网和代谢网的健壮性使得通信网不会因为局部的攻击和故障
而导致这个系统崩溃,同样急剧变化的环境和大量使用药物也不会对一个相当简
单的组织生长造成影响。复杂系统的这种稳定性应归功于网络中节点的择优连接,
可以证明这种性质是无标度网络所特有的。因此设计信息网的首选应是具有 SF 拓
扑并提防局部问题扩大到整个系统,相反针对传染病网络的无标度的拓扑结构,
控制疾病的手段只能是对连接中心作出有效的免疫。研究结构证明 Internet、
会网络、细胞网络等许多真实网络都是无标度网络。
§1.2 选题意义
《2006 中国互联网络信息资源数量调查报告》显示,电子商务网站为我国提
供了 32 万个就业岗位,直接创造的就业机会达 110 万个,而第三方物流和配送行
业还会带来上千万人的就业机会。淘宝内部数据显示,仅在 2005 年以来,国内已
有超过 5 万人在淘宝网上直接或间接就业,其中三分之一强为自己创业的网店老
板,网络销售中超低的成本是他们作此职业选择的主要原因,加上每个"店面"招
揽的财务、物流、售后服务人员,解决的就业岗位超过 10 万。
据了解,在北京、上海等大城市,网上创业就业已经是一支非常庞大的队伍,
网络拍卖这一新型商业模式为越来越多人带去新的商机。淘宝网总经理孙彤宇认
为,不能说每个人到淘宝自己开店上都能赚大钱,但这是一个尝试的机会,门槛
很低,而淘宝希望用免费的方式做出更好的服务来拆除目前的尝试门槛。
吴霁东 2004 年在淘宝网上开设了一家摄影器材专卖店,经营的商品曾经被朋
友们断定为偏门不被看好,然而如今她经营的"东东小铺",从最初的 40 件商品在
不到一年间网络销售额达 70 万元,而她个人在 2005 年也被评选为中国十大网商。
家境贫寒的海南大学生郭耀华 2004 下半年休学一年,在淘宝网上开店,如今,
的"星星源特价手机总店"又接连开了两家网上分店,顾客遍及全国,月营业额平
均在 5 万元左右。上海一位下岗女士在淘宝上办了一家童装店,就用一台电脑
一部数码相机和 3000 元资金,在网上销售原单童装,目前这个网上童装店在旺季
摘要:

摘要近年来,电子商务作为一种新兴的商务模式,广泛的在网络上流行起来。我们研究的淘宝网是电子商务中的代表网站。众所周知,淘宝网的店家通过相互的友情链接,形成了一个巨大的虚拟网络。由于开店的店主越来越多,这个网的规模越来越大,普通的分析方法受到了局限,我们便可以运用复杂网络的思想来分析一下。以往对于电子商务网站的分析,基本都是以对网上用户的调查和网络运营方式为主,本文从存在网络店铺间的联系为切入点,通过对其系统的结构特征,网络的演化方式,以及加权网络的特征,对电子商务网进行了系统的分析和阐述。首先本文通过编写网络机器人对现有的淘宝网的数据搜集,构建了一个由128586个店铺和818219条店铺间的...

展开>> 收起<<
基于复杂网络的商铺链接合作网的研究.pdf

共64页,预览7页

还剩页未读, 继续阅读

作者:陈辉 分类:高等教育资料 价格:15积分 属性:64 页 大小:1.97MB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 64
客服
关注