时态约束关联规则挖掘的研究
![](/assets/7a34688/images/icon/s-doc.png)
VIP免费
基于时态约束的关联规则挖掘的研究
时态约束关联规则挖掘的研究
0.引言
传统关联规则很少研究关联规则的时间适用性。而时间是所有现实现象的基本属性。在现实
问题中,任何事件都和时间相联系并受一定的时态关系约束,因为任何事件都是在一定的时间发
生,又在一定的时间消失。传统的数据库记载着现实世界中的各种数据,但是它仅仅能体现现实
世界中数据的当前状态,只反映了一个对象在某一个时刻的状态(快照),不联系其过去和未来。
时态数据库的出现必然要求在知识发现的过程中考虑时间因素,附加上某种时态特征的规
则将可以更好地描述客观现实情况,得到的规则也就越准确,更有价值,同时助于提高数据库系
统的可靠性和效率。
1. 时态关联规则挖掘过程
在数据库中,数据经过一段较长的时间段,隐含了一些有价值的知识发生的片断。时态关联
规则技术能提供一种工具让人们挖掘出各时间间隔内的时态数据所含信息的关联规则。通过对这
些关联规则的分析,人们能观察到各时间间隔序列中时间发生的变化规律。
时态关联规则为了能真正反映不同时间间隔内的时间数据的内在规律,通常分为三个子过
程:
1、初始阶段:先行决定历史数据积累的时间间隔,包括时间的间隔长度、间隔数;然后,再
将具有时态约束的数据库中的数据按不同的时间间隔分别划分为相应的数据子集。
2、关联规则发现阶段:再每个时间间隔内,运用相应的支持度和置信度的阈值,进行关联
规则开采。
3、结果关联规则的表达:如果在连续的时间间隔内,发现的频率项集比较少,那么很容易
得到连续时间间隔内的频繁集的变化趋势。相反,如果在一些时间间隔内发现的频繁项集数目比
较多,那么,需要借助一些工具来分析
尽管对时态关联规则已有一些研究,但是这些研究主要是在一个时间段上来考虑关联,而
采用的方法也是用原来没有时间的方法研究,本质上没有对时态数据在不同时间粒度上进行挖掘
更深层次的知识。因此需要对时态数据建立一种比较规范的系统模型,得到的时态关联规则的意
义是广泛的。
3 时态约束关联规则发现与应用
3.1 时态约束关联规则关键问题
(1)时态关联规则挖掘分为两个部分,其中找出所有时态频繁项集是最重要的一步,也是
决定算法效率关键性的一步。要寻找所有时态频繁项集,就要解决如下几个问题:
(2)关联规则时间区域的生成,即时态频繁项集时间区域的生成。具体到算法,就要找出
1-项集成立时间区域,因为1-项集是种子,通过1-项集的连接,就可以产生k-项集的时间区域。
(3)k-项集的生成问题,包括项集生成以及时 间区间生成,接着就是如何利用时态频繁
项集特点进行剪枝,从而缩小算法的搜寻空间。
针对这两个问题,本文尝试利用聚类算法解决第一个问题,利用Apriori剪枝算法进行修改,
以解决第二个问题。
3.2 Fisher 聚类算法
对于第一个问题,典型的办法就是把数据库整个时间列等分成n个时间区域,然后在这些时
间区域运用一般关联规则算法挖掘,从而发现关联规则的时间区域。这种办法不考虑项集的时间
分布,比较粗糙。另外一个办法是首先通过扫描数据库,搜寻每个1-项集的出现时间和结束时间,
即1-项集的生存周期,把生存周期作为1-项集有效时间区间,扩充1-项集,然后在迭代过程中
通过时间区域交集求得k(k>1)-项集的时间区域。它方便简单,易于操作,但有个缺点,它 假定
项集分布在生存周期内是均匀的,而在现实当中项集交易个数往往会集中在几个很窄的时间区间
摘要:
展开>>
收起<<
基于时态约束的关联规则挖掘的研究时态约束关联规则挖掘的研究0.引言传统关联规则很少研究关联规则的时间适用性。而时间是所有现实现象的基本属性。在现实问题中,任何事件都和时间相联系并受一定的时态关系约束,因为任何事件都是在一定的时间发生,又在一定的时间消失。传统的数据库记载着现实世界中的各种数据,但是它仅仅能体现现实世界中数据的当前状态,只反映了一个对象在某一个时刻的状态(快照),不联系其过去和未来。时态数据库的出现必然要求在知识发现的过程中考虑时间因素,附加上某种时态特征的规则将可以更好地描述客观现实情况,得到的规则也就越准确,更有价值,同时助于提高数据库系统的可靠性和效率。1.时态关联规则挖掘...
相关推荐
-
VIP免费2025-01-09 9
-
VIP免费2025-01-09 6
-
VIP免费2025-01-09 6
-
VIP免费2025-01-09 6
-
VIP免费2025-01-09 6
-
VIP免费2025-01-09 9
-
VIP免费2025-01-09 8
-
VIP免费2025-01-09 7
-
VIP免费2025-01-09 8
-
VIP免费2025-01-09 7
作者:朱铭铭
分类:高等教育资料
价格:150积分
属性:7 页
大小:447.5KB
格式:DOC
时间:2024-09-20