基于样本熵理论的时间序列分析

VIP免费
3.0 侯斌 2024-11-19 4 4 2.04MB 45 页 15积分
侵权投诉
熵作为非线性分析度量工具,通过计算随机事件产生的概率来衡量时间序列
的复杂程度,被广泛应用于各个领域。熵定义基于概率论和统计物理的基本假设。
这一概念用于分析现实中的时间序列时,这些假设并不满足。比如,时间序列是
有限长度的、非定态的。文献中提出了近似熵、样本熵、和二次样本熵等概念来
解决熵在现实应用中存在的涨落、系统误差等问题。
本文将二次样本熵算法带入道琼斯平均工业指数的每日收盘数据中。结果发
现,二次样本熵结果的准确性和灵敏度远远高于样本熵算法,并且在数据长度仅
20 的情况下依然表现出很好的检测结果。多个国家和地区多年的日股票收盘
数据带入二次样本熵方法,比较不同股票市场在相同时间段内的稳定程度,评估
各个股票市场间的联系以及抵抗危机能力的强弱,结果与本研究预期相吻合。
Richman Moorman 基于样本熵算法提出了交叉样本熵的概念,作为衡量两
个时间序列同步性的尺度。本文将交叉样本熵用于两个股票收益时间序列,评估
它们的非同步性程度。对美国与中国各三只股指亚洲经济危机前后的收益序列的
交叉样本熵值作对比。结果表明六支股指之间,上证指数与深证成指的同步性最
强,表明上海和深圳股票市场内在联系紧密。同时发现,经济危机之后中国股票
市场内部同步性减弱,美国股票市场内部同步性增强。在选取十一个国家和地区
最近两年的日股指收益序列研究中,本文进行了两两之间的交叉样本熵值比较。
结果表明处于相同地理区域或者文化联系紧密的市场之间具有较低的交叉样本熵
值,即具有较强的同步性。同时发现,大多数国家和地区和日本股指收益序列具
有较强的同步性,说明日本经济与世界经济发展相关性较高。
短时间序列分析 同步性 样本熵 二次样
本熵 交叉样本熵
ABSTRACT
Entropy as a valuable non-liner analysis tool is applied widely in various fields. It
measures the complexity of time series by calculating the probability of a random
event happens. It is defined on probability and statistical physics, and consequently
requires some essential hypothesis. However, when we use entropy to investigate real
world time series, the assumptions are violated. For instance, real world time series are
generally non-stationary and finite. In literature, a series of concepts, including
Approximate Entropy(ApEn), Sample Entropy(SampEn) and Quadratic Sample
Entropy(QSE), are proposed to solve the violation induced problems, such as large
fluctuations and systematic errors.
In the present thesis, the QSE is used to investigate the Dow Jones Industrial
Average daily series. QSE is found to be much more accurate and sensitive compared
with SamEn. It performs well even the length reaches 20. We study further the daily
stock series of different countries and areas to find the inner connections between the
markets and the crisis withstand abilities of the stock markets. The results are
consistent with our expections.
Based on the SampEn method, Richman and Moorman introduced Cross-sample
entropy, as a measurement of synchronicity between two time series. In the thesis,
Cross-SampEn method is used to find the synchronicities in high-dimensional time
series. We selected three stock index return series from China and USA stock market
respectively and divided them into two periods: before or after Asian currency crisis.
Then we compared the Cross-Sample entropies of every pair of series in two periods.
The result shows that the synchronicity of Shanghai Composite Index and Shenzhen
Composite Index was the highest among all the pairs, which means the inner-related
between Shanghai and Shenzhen stock market is strong. Meanwhile we find that the
synchronicity inner Chinese stock market becomes weak, however the USA market
presents an opposite tendency. Further calculations on eleven index return series of
different countries and areas of latest two year show that the areas in the same
geographic regions or have closely cultural connections have smaller entropies, that is
to say, have stronger synchronicity. At the same time, we found that Japanese stock
series have stronger synchronicity with the most of the other stock series. It implies
that Japanese stock market has a strong influence to the worldwide stock markets.
Key Word: Econophysics, Short time series analysis, Complexity,
Synchronism, SampEn, QSE, Cross-SampEn
中文摘要
ABSTRACT
第一章 绪论 ........................................................ 1
1.1 课题背景介绍 ................................................. 1
1.2 国内外研究现状 ............................................... 1
1.3 主要研究内容 ................................................. 3
第二章 基本理论和算法介绍 .......................................... 5
2.1 近似熵 ....................................................... 5
2.2 样本熵 ....................................................... 7
第三章 样本熵算法的修正及其在股票数据中的应用 ..................... 10
3.1 二次样本熵算法介绍 .......................................... 10
3.1.1 样本熵算法分析和修正 ................................. 10
3.1.2 参数的选择 ........................................... 12
3.2 样本熵方法在股票序列上的应用 ................................ 15
3.2.1 样本熵在股票序列上的应用 ............................. 16
3.2.2 二次样本熵在股票序列上的应用 ......................... 19
3.3 不同股票之间的二次样本熵熵值比较 ............................ 24
3.4 结论 ........................................................ 25
第四章 交叉样本熵在股票时间序列上的应用 ........................... 29
4.1 交叉样本熵算法介绍 .......................................... 29
4.2 亚洲金融危机前后中美两国股市同步性分析 ...................... 30
4.3 不同国家和地区间股市同步性分析 .............................. 33
4.4 本章小结 .................................................... 35
第五章 总结与展望 ................................................. 36
5.1 总结 ........................................................ 36
5.2 本文未解决的问题以及未来的发展方向 .......................... 36
参考文献 ........................................................... 38
在读期间公开发表的论文和承担科研项目及取得成果 ..................... 42
............................................................. 43
第一章 绪论
1
第一章 绪论
1.1 背景介绍
时间序列分析是一种动态处理数据的统计方法,旨在从复杂系统的输出序列
中提取结构特征,增加对复杂系统结构和动力学机制的认识。它是一种以随机过
程和数理统计方法为基础,以探寻各种随机时间序列内在统计规律的方法体系。
时间序列分析被广泛应用于经济、金融、生物和环境等领域中大量有序数据的分
析,是众多学科领域共同关心的焦点。但是现实中存在很多客观因素的影响导致
时间序列分析难以达到理想的效果[1][2]
(1) 实际操作中的时间序列往往很短,如 1个小时的心跳序列只能达到 4000
个长度。并且对病人或受试者进行长达一小时或以上的测量常难以实现;
(2) 尽管某些情况可以获得够长度的数据,但是序列生成过程中,往
往会受到各种外界或内在因素的影响。或者发生了系统动力学过程突变,导致序
列结构特征发生变化,例如股票市场会受到经济事件或者货币税收政策的冲击。
此时需要把时间序列分割成若干个结构特征统一的片断,分别研究各片段的局部
特征;
(3) 由于测量方法、仪器、环境等客观原因,实际采集到的序列往往受到噪
声的污染,有时候真实信号会被淹没在噪声中;
(4) 由于环境或者复杂系统参数在大时间尺度范围上变化,一般来讲时间序
列是非定态的,也就是说时间序列中存在着大尺度上的趋势。
随着非线性时间序列分析进一步的发展,研究的问题逐步从关注不同复杂系
统中的共性,发展为比较不同复杂系统或同一复杂系统在不同条件下的行为,发
现其中的个性特征。因此,短序列特征的提取显得尤为重要。
目前已经存在了很多时间序列的分析方法,但它们大多数都是对序列构造统
计量。但是往往由于数据长度的限制,这些统计量具有系统偏差。因此,本研究
的目的是将这些偏差修正并发展出真正有效的短时间序列分析方法。
1.2 国内外研究现状
香农在 1948 年定义了信息熵[3]他以概率与数理统计为工具,将离散的信息
源当作若干随机发生的事件,用每个事件发生的概率来表示其不确定程度。各个
事件的出现概率不相同,则平均信息量,即信息熵定义为:  

它也被称为香农熵[4]其中为第 i个信息出现的概率,并且 
。从信息
摘要:

摘要熵作为非线性分析度量工具,通过计算随机事件产生的概率来衡量时间序列的复杂程度,被广泛应用于各个领域。熵定义基于概率论和统计物理的基本假设。这一概念用于分析现实中的时间序列时,这些假设并不满足。比如,时间序列是有限长度的、非定态的。文献中提出了近似熵、样本熵、和二次样本熵等概念来解决熵在现实应用中存在的涨落、系统误差等问题。本文将二次样本熵算法带入道琼斯平均工业指数的每日收盘数据中。结果发现,二次样本熵结果的准确性和灵敏度远远高于样本熵算法,并且在数据长度仅为20的情况下依然表现出很好的检测结果。将多个国家和地区多年的日股票收盘数据带入二次样本熵方法,比较不同股票市场在相同时间段内的稳定程度...

展开>> 收起<<
基于样本熵理论的时间序列分析.pdf

共45页,预览5页

还剩页未读, 继续阅读

作者:侯斌 分类:高等教育资料 价格:15积分 属性:45 页 大小:2.04MB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 45
客服
关注