自相似网络流量仿真及分析

VIP免费
3.0 陈辉 2024-11-19 5 4 1.13MB 61 页 15积分
侵权投诉
摘 要
随着 Internet 的高速发展,网络业务的研究成为一个热点,网络流量自相似
性的发现对我们进行流量建模和性能评价的研究有着非常重要的影响,传统的泊
松(Poisson)模型已不能有效地描述所观察到的网络流量特性。FBM 模型是一种
简单并且易于求解的模型,本文首先介绍时间序列中的自相似定义,对由 FBM
型生成的时间序列估算其 Hurst 指数,描述其自相似程度,通过两种不同的方法估
Hurst 指数。
网络环境中的系统有着非线性动力学特征,表现出混沌吸引子和分形结构,
它们是一种非线性的、耗散的、非平衡的复杂系统。本文基于 FBM 模型产生自相
似仿真流数据,即随着时间的变化的包到达数量的序列。根据不同的时间间隔对
数据进行处理。相空间重构理论是我们进行非线性建模的基本步骤,近年来得到
广Ruell
PackardTakens 等先后引入动力学系统中,是非线性动力系统中重要的一步,为
了重构好相空间,必须选择合适的延迟时间
和嵌入维数
m
。本文利用 Takens
标延迟的状态空间重构方法,重构出原时间序列,确定延迟时间的方法有自相关
函数法,互信息法和平均位移法,它们各有优缺点,本文利用自相关函数来求网
络流量时间序列的延迟时间,用 Grassberger-Procaccia algorithmG-P 算法)计算
关联维数。为了滤除序列中不规则成分,本文用小波分析方法处理非线性时间序
列,对于网络流量时间序列,我们在其不断变化的过程中集中于局部信号结构,
可以很好的减少了尺度参数。为了达到上述目的,本文采用基于 Daubechies 小波
的离散小波变换。众所周知,小波方法能很好的滤除被分析信号的高频成分和低
频成分。通过小波滤波去掉噪声部分,并且呈现出延迟时间和嵌入维数的更可靠
的值,然后用坐标延迟法重构出动态系统。
滤除了序列中的噪声成分,我们用 G-P 算法获得了潜在动态过程嵌入维数的
更可靠地结果,这一结果也被主成分分析法(PCA)所证实,主成分分析法在
变量时间序列中应用广泛,包括对原始数据进行线性空间转换,即数据被一些有
用的有效特征量代替而能保持数据固有特性。Caterpillar-SSA 方法新颖,对分
析时间序列非常有效。根据主成分分析法对原始序列进行重构,也即生成新的网
络流量时间序列,与上述坐标延迟法重构结果相吻合。
关键词:网络流量 自相似 相空间重构 小波滤波 主成分分析
ABSTRACT
With the rapid development of Internet , network services research has been
developed as a hot issue , the finding of self-similarity of network traffic has a very
important influence on traffic modeling and its performances evaluation . The
traditional Poisson model is not effective for the description of the network traffic
characteristics observed .
FBM model is a model of simple and easy to solve , this paper first describes the
definition of self-similar time series , and we estimated the Hurst index of the time
series generated by the FBM model. We described the lever of self-similarity by two
different methods of estimating the Hurst index .
In network environment , there are different kinds of non-linear dynamic
characteristics in the system , showing the chaotic attractor and a fractal structure,
which is a nonlinear , dissipative , non-equilibrium complex systems. Based on the
FBM model , self-similar simulation flow data are produced, that is the number of
packet arrival sequence over time . Depending on the time interval for data processing.
Phase space reconstruction theory has been widely used in recent years , which is the
basic step of non-linear modeling , the concept of phase space reconstruction first
appeared in the field of statistics . Later it was successively introduced in dynamics
systems by Ruell , Packard and Takens , which is an important step in nonlinear
dynamical systems , in order to well reconstruct the phase space , you must select the
appropriate delay time and embedding dimension . In this paper, Takens delay
coordinate reconstruction method is used to reconstruct the original time series .
Methods to determine the delay time including the autocorrelation function method, the
mutual information method and average displacement method , they have their own
advantages and disadvantages , auto-correlation function is used in this paper to
estimate the delay time of network traffic time series , with Grassberger-Procaccia
algorithm (GP algorithm) to compute the correlation dimension . In order to filter out
the irregular component in the sequence , wavelet analysis was utilized in nonlinear
time series , for network traffic time series , we can focus on local signal structure in the
changing the course , it can well reduce the scale parameter . To achieve the above
purpose , we use Daubechies wavelet-based discrete wavelet transform . As we all
know , the wavelet method can well filter high frequency and low frequency signal
components . Remove noise part by the wavelet filtering , and showing the more
reliable values of delay time and embedding dimension , then reconstruct dynamic
system with the delay coordinate method .
After filtering out the noise component of the sequence , we use the GP algorithm
to obtain the embedding dimension in the dynamic process with a more reliable results ,
this result has also been confirmed by principal component analysis (PCA) , the
principal component analysis is widely used in multivariate time series , including the
original data conversion in linear space , where the data set may be represented by a
reduced number of features and maintain the inherent characteristics. "Caterpillar"-SSA
method is novel and effective for analysis of time series. According to principal
component analysis to reconstruct the original sequence , in other words we generates a
new network traffic time series , and the result is coinciding with the result using delay
coordinate reconstruction method .
Key words: network traffic self-similarity phase space
reconstruction
wavelet filtering
principal component analysis (PCA)
目 录
中文摘要
ABSTRACT
第一章 绪 论............................................................................................................1
§1.1 课题背景介绍............................................................................................1
§1.2 国内外研究现状........................................................................................2
§1.3 本文主要研究内容....................................................................................4
第二章 自相似及网络流量模型..............................................................................5
§2.1 自相似过程的描述....................................................................................5
§2.2 自相似过程的一般模型.............................................................................6
§2.2.1 连续时间的 FBM ...........................................................................6
§2.2.2 分形高斯噪声 ..............................................................................7
§2.2.3 分形 ARIMA 模型 ........................................................................10
§2.3 网络流量模型的建立..............................................................................11
§2.3.1 网络流量的定义及其特性..........................................................11
§2.3.2 网络流量模型研究的现有成果..................................................12
§2.4 本章小结..................................................................................................13
第三章 自相似指数及网络流量数据获取............................................................14
§3.1 赫斯特参数 H 的估计方法......................................................................14
§3.1.1 方差-时间曲线............................................................................14
§3.1.2 R/S 分析方法...............................................................................14
§3.1.3 简要小波分析方法......................................................................16
§3.1.4 基于频域的周期图法..................................................................17
§3.1.5 极大似然估计法(MLE)............................................................17
§3.2 不同的方法预测 Hurst 指数及结果分析..............................................18
§3.3 实例分析..................................................................................................22
§3.4 网络流量的数据仿真获取......................................................................24
§3.5 网络流量的自相似检测..........................................................................26
§3.6 本章小结..................................................................................................27
第四章 网络流量的动态系统重构........................................................................28
§4.1 动态系统参数预测..................................................................................28
§4.1.1 预测相关长度(延迟时间) ....................................................28
§4.1.2 预测嵌入维数..............................................................................32
§4.2 网络流量的小波滤波..............................................................................33
§4.2.1 小波阈值去噪...............................................................................34
§4.2.2 小波滤波后动态系统参数预测..................................................36
§4.2.3 相关系数分析..............................................................................37
§4.3 动态系统重构..........................................................................................38
§4.3.1 坐标延迟重构..............................................................................38
§4.3.2 利用小波进行信号重构..............................................................39
§4.4 网络流量的统计分布..............................................................................41
§4.5 本章小结..................................................................................................42
第五章 网络流量的主成分分析............................................................................44
§5.1 《Caterpillar》-PCA 的基本概念与分析目的...................................44
§5.2 主成分分析方法(Principal Component Analysis ,PCA)............45
§5.3 主成分的综合评价及趋势预测..............................................................48
§5.4 主成分分析法构造新序列......................................................................49
§5.5 网络流量的谱分析..................................................................................50
§5.6 本章小结..................................................................................................52
第六章 总结与展望................................................................................................53
§6.1 总结..........................................................................................................53
§6.2 展望..........................................................................................................54
参考文献 ....................................................................................................................55
在读期间公开发表的论文和承担科研项目及取得成果 ........................................58
致谢..............................................................................................................................59
第一章 绪论
1
第一章 绪 论
§1.1 课题背景介绍
Mandebrot 在上世纪 60 年年代开始关注有偏随机游走现象并进行了全面深入
的研究,提出了一种模型叫做分形布朗运[1]。这种分形特征结构理论模型赋予
投资者在市场定性决策方面循环、趋势等概念及可以度量的数量特征,其中 Hurst
指数的强健性对于时间序列分析有着重要作用,特别是我们通常遇到的是非 Gauss
型随机数据,Hurst 指数进行估算非常重要,它刻画了时间序列自相似程度以
及序列发展的趋势。本世纪中叶,对自相似过程的研究处于起始阶段,之后,自
相似现象在许多领域中被发现并且将它运用于电子、天文、地理、化学以及环境
科学等众多领域。近年来,随着研究深入,人们愈加关注这一现象,并以自相似
参数 H来描述这个过程,如果一个自相似过程有平稳增量并且 H1/2,1)则其
增量本身作为一种过程就构成了参数为 H的一个长相关过程。
网络的发展庞大且复[2],包含诸多因素,多个因素共同作用决定系统发展
走向。分析的不全面,用户需求的急速增加以及不稳定的网络系统演化是我们进
行流量建模长期面临的问题,基于结果的可靠、可行,若要满足用户需求,系统
模型需抓住实际网络流量的特征。对网络流量细节问题的分析包括宽带需求、平
均下载量等,而流量模型的作用是使专业网络设计者据经验给出假设并且能够作
出预测,包括需求的一些特征。网络流量的模型为实际模型的一部分而且我们能
用来对离散事件进行仿真(DES.广
poisson 分布模型,Pareto 分布过程,Weibull 分布过程,Markov 模型,自回归模
型。
当自相似[3]参数 H在数学上被很好的定义的同时,对它进行测量也成了问题,
必须在低频下测量数据,在时间序列中检测非线性结构在统计学和经济学领域中
很重要,非线性技术[4]能使我们更好的理解网络流量的主要特征。为了重构潜在
的动态系统,需要预测流量序列相关长度和嵌入维数。用混沌理[5]对信号进行
处理的首要步骤就是对信号进行相空间重构,混沌理论为我们提供了研究的一个
新方法,混沌时间序列分析来处理不规则的时间序列。假设在网络动力学系统中,
我们可以观测到的单变量时间序列为:
)(),...,(),( 21 n
txtxtx
将它嵌入到 m维相空
[6],可得 m维延迟矢量为:
摘要:

摘要随着Internet的高速发展,网络业务的研究成为一个热点,网络流量自相似性的发现对我们进行流量建模和性能评价的研究有着非常重要的影响,传统的泊松(Poisson)模型已不能有效地描述所观察到的网络流量特性。FBM模型是一种简单并且易于求解的模型,本文首先介绍时间序列中的自相似定义,对由FBM模型生成的时间序列估算其Hurst指数,描述其自相似程度,通过两种不同的方法估计Hurst指数。网络环境中的系统有着非线性动力学特征,表现出混沌吸引子和分形结构,它们是一种非线性的、耗散的、非平衡的复杂系统。本文基于FBM模型产生自相似仿真流数据,即随着时间的变化的包到达数量的序列。根据不同的时间间隔...

展开>> 收起<<
自相似网络流量仿真及分析.pdf

共61页,预览7页

还剩页未读, 继续阅读

作者:陈辉 分类:高等教育资料 价格:15积分 属性:61 页 大小:1.13MB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 61
客服
关注