环境与细胞网络结构

VIP免费
3.0 牛悦 2024-11-19 4 4 1.7MB 49 页 15积分
侵权投诉
摘 要
通过复杂网络结构分析来研究生物进化、疾病等相关问题是如今学术研究的
一个热点。细胞网络是众多因素共同作用的结果,比如,环境、温度、盐度等因
素的影响。从细胞网络中挖掘环境、进化、疾病等信息,得到这些因素在生物体
生命延续过程中的贡献,及这些因素之间的相互关系和影响,成为如今细胞网络
研究中普遍关注的问题和方向,因此,掌握构建细胞网络的方法显得尤为重要。
本文提出了构造代谢网络的改进方法,以鱼腥藻作为实例,利用 KEGG 数据库重
构出鱼腥藻的代谢网络,讨论了该网络的拓扑结构性质。
代谢网络的拓扑结构不仅可以提供物种代谢能力上的重要的见解,也可以提
供其进化所在的栖息地的重要见解。在此引入一个代谢网络的种子集(由外部环
境获得的,基于网络拓扑结构的化合物的集合)的概念,并提供一个用以计算推
断一个给定网络的种子集的方法。这种种子集形成了代谢网络与其周围环境间的
生态接口能够对物种的生活环境信息有所反应。分析了 478 个物种的代谢网络,
并确定了每一物种的种子集,种子集的系统进化分析揭示了复杂动力学跨系统发
育树支配的增减以及种子与非种子化合物间的转变过程。我们的发现,种子的状
态是暂时的,种子往往从网络上消失或者很快成为非种子化合物。种子集还可以
对生命的系统发生树进行成功的重建。
通过代谢网络的拓扑结构性质以及种子集的研究方法,对肠出血性大肠杆菌
致病原理进行了研究。重构了 29 种大肠杆菌和一种弗格森埃希氏菌的代谢网络。
对网络进行模块划分,以及计算出每种菌体的网络种子集。通过网络拓扑性质研
究不同致病性大肠杆菌的差异。通过种子集的差异,研究不同菌体对外界环境需
求的不同,从而得出致病信息。
结构洞是用来估计网络各节点间竞争力的一个非常重要的概念。在本文中,
我们引入的一个新的和比较全面的测量结构洞的方法,即,用主成分分析的方法
基于基尼系数的结构洞测量。通过对比 BA 网络,小世界网络模型和真实的社会网
络得出此方法的有效性,并与其它结构洞测量方法对比得出此方法的优越性。该
方法可用于对生物进化方面的研究。
关键词:代谢网络 KEGG 种子集 短时间序列 扩散理论
ABSTRACT
Physical interactions and/or chemical reactions in cell integrate multi-factors
and/or molecules into complicated systems, called cellular networks. Structural analysis
of cellular network can reveal rich information on evolution, disease, and environment,
which has been a persistent hot topic for more than ten years.
Firstly, we introduce a new strategy in reconstructing metabolic network. As a
typical example, we construct from chemical reaction list in KEGG database the
metabolic network for the species anabaena. Topological properties of the generated
network are investigated in detail.
Secondly, by means of the concept of seed set we measure quantitatively special
features of surrounding environment of species. Seed set can provides evolution of a
species in habitat and its responds to ecological changes. Metabolic networks for a total
of 478 species are reconstructed and investigated. Seed set based phylogenetic analysis
reveals systematic growth tree of the species. Our findings suggest that seed state is
temporary, namely, seeds from the Internet often disappear or soon become the seeds of
compound. Seeds of life set can also occur for successful tree system reconstruction.
Specially, we consider in detail 29 kinds of E. coli.. Different pathogenic Escherichia
Coli are distinguished properly. Different bacteria requires significantly specific
environment, from which one can obtains pathogenic information.
Finally, structural hole is used to estimate competitiveness nodes. We introduce a
new and more comprehensive measuring method of structural hole, namely, use the
principal component analysis method. By comparing the BA network, small world
network model and real social network, we find that this method is effective. A
potential use is to infer clue of biological evolution from present structures of cellular
networks.
Key Word: metabolic network, KEGG, seed set, short time series,
diffusion theory
目 录
中文摘要
ABSTRACT
第一章 绪论 ........................................................ 1
§1.1 课题背景介绍 ................................................. 1
§1.2 国内外研究现状 ................................................1
§1.3 本文主要研究内容 ............................................. 3
第二章 复杂网络理论与网络结构 ....................................... 4
§2.1 复杂网络理论 ................................................. 4
§2.1 .1 复杂网络的结构参数 ....................................... 5
§2.1.2 复杂网络的基本模型 ........................................ 8
§2.2 复杂网络结构分析 ............................................ 10
§2.2.1 模块划分 ................................................ 10
§2.2.2 种子集 .................................................. 11
§2.2.3 结构洞的测量方法介绍 ..................................... 12
第三章 代谢网络重构 ................................................ 16
§3.1 研究背景 .................................................... 16
§3.2 数据及方法 .................................................. 17
§3.2.1 代谢数据库 .............................................. 17
§3.2.2 图论术语 ................................................ 17
§3.3 代谢网络重构 ................................................ 18
§3.3.1 代谢反应数据 ............................................. 18
§3.3.2 反应与酶的关系 .......................................... 18
§3.3.3 酶与基因的对应关系 ....................................... 19
§3.4 代谢图 .......................................................19
§3.4.1 初步代谢图 ............................................... 19
§3.4.2 代谢图的修正 ............................................. 20
§3.4.3 反应图 ................................................... 21
§3.4.4 酶图 ..................................................... 22
§3.5 实例:鱼腥藻代谢图 ...........................................22
§3.6 本章小结 .................................................... 23
第四章 基于网络结构的大肠杆菌致病性分析 ............................ 24
§4.1 背景介绍 .................................................... 24
§4.2 确定种子集的方法 ............................................ 24
§4.3 运用种子集研究大肠杆菌致病性 ................................ 27
§4.3.1 数据 .................................................... 27
§4.3.2 方法 .................................................... 28
§4.4 结果与讨论 .................................................. 30
§4.5 本章小结 .................................................... 32
第五章 基于基尼系数的网络结构洞测量 ................................. 33
§5.1 研究背景 .................................................... 33
§5.2 算法 ........................................................ 33
§5.2 .1 基于主成分分析的结构洞的测量 ........................... 33
§5.2 .2 数据 ................................................... 35
§5.2 .3 结果 ................................................... 36
§5.2 .4 与其他结构洞测量方法的比较 ............................. 37
§5.3 结论 .........................................................38
第六章 总结与展望 ................................................... 40
§6.1 总结 ........................................................ 40
§6.2 本文未解决的问题以及未来的发展方向 .......................... 40
参考文献 ............................................................ 41
在读期间公开发表的论文和承担科研项目及取得成果 ...................... 46
.............................................................. 47
第一章 绪论
1
第一章 绪论
§1.1 课题背景介绍
复杂性科学兴起于 20 世纪,到了 21 世纪初已经成功引起了国内外诸多专家
学者的高度关注,现已迅速渗透到社会科学、生命科学等各个领域,促进了交叉
学科的发展。
大量的生物系统都能被看成是网络,网络包含了它们许多的基本性质[1]这些
生物网络的结构与拓扑结构不只是对一给定系统内复杂相互作用的抽象描述,也
是系统功能和动力学的决定因素。这一广泛的分析方法已被用于研究代谢网络
拓扑性质和它们在各种代谢功能上的关系,包括规模[2],调节[3],普遍性[4],和代
谢基因敲除的鲁棒性[5, 6]。此外,由于代谢网络在生化环境中实现功能,并通过占
用和分泌各种有机和无机化合物与这些环境相互作用,因此,已有的研究也着重
指出了这些环境交互作用对代谢网络的影响。已证实的如,网络中代谢流的分布[7]
或者有机物的增长率[8]
基于网络模块性质的细胞网络研究是项引人注目的研究课题。细胞在功能上
是模块化的,细胞内空间上独立的或者化学上特定的许多生物组分共同完成一个
生物功能,如蛋白质复合物、信号、代谢通路、转录集团等。从进化角度,细胞
内形成一些各自内部联合进化的集团,即进化模块。在同一功能模块内的组分,
往往具有一致的进化特征。一些进化模块涵盖了已知的功能模块[910]
细胞网络拓扑结构也是模块化的。也就是细胞网络可以划分成若干个结构集
团,在集团内部各个节点紧密的连接在一起,而在不同的集团之间则只有很少的
边相连。在不同尺度上的模块化构成网络的层次结构。网络拓扑结构的模块是按
照功能形成的[11],因此,基于网络模块性质的细胞网络研究是当前最为成功的
究课题之一。
社会生活可以看成一个复杂网络,随着社会的发展复杂网络越趋于结构化。
在社会网络中如何取得竞争优势,如何处于优越地位是每个国家、团体以及个人
都十分关心的问题。因此,社会结构分析是众多学术研究的热点为问题,也是关
系到每个人切身利益的问题。
本文的工作是把复杂网络理论和网络结构分析方法运用到生物代谢网络和和
社会网络中。从众多的网络分析方法中期望能够提取到新的信息以及更好地分析
方法,从而进一步加深对复杂系统结构及其动力学机制的认识。这些方法同样可
以应用于生物进化、生物医学、生命科学、金融等领域进行相关分析。
§1.2 国内外研究现状
生物的后基因组研究的主要目的是系统的记录所有分子及其在活细胞内的相
摘要:

摘要通过复杂网络结构分析来研究生物进化、疾病等相关问题是如今学术研究的一个热点。细胞网络是众多因素共同作用的结果,比如,环境、温度、盐度等因素的影响。从细胞网络中挖掘环境、进化、疾病等信息,得到这些因素在生物体生命延续过程中的贡献,及这些因素之间的相互关系和影响,成为如今细胞网络研究中普遍关注的问题和方向,因此,掌握构建细胞网络的方法显得尤为重要。本文提出了构造代谢网络的改进方法,以鱼腥藻作为实例,利用KEGG数据库重构出鱼腥藻的代谢网络,讨论了该网络的拓扑结构性质。代谢网络的拓扑结构不仅可以提供物种代谢能力上的重要的见解,也可以提供其进化所在的栖息地的重要见解。在此引入一个代谢网络的“种子集...

展开>> 收起<<
环境与细胞网络结构.pdf

共49页,预览5页

还剩页未读, 继续阅读

作者:牛悦 分类:高等教育资料 价格:15积分 属性:49 页 大小:1.7MB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 49
客服
关注