0629-11451414
当前位置:主页»荣誉资质»荣誉资质»

数据挖掘中的关联规则挖掘算法

文章出处:金沙官网首页 人气:发表时间:2024-03-16 01:45
本文摘要:关联规则按照有所不同的标准,能用各种有所不同的方法分为有所不同类型。

金沙官网首页

关联规则按照有所不同的标准,能用各种有所不同的方法分为有所不同类型。将关联规则分成挖出频密项集、紧频密项集、被约束频密项集、很大频密项集,是根据挖出模式的完全性分类的;将关联规则分成多层和单层关联规则,以及单位和多维关联规则是根据规则所牵涉到的数据展开分类的;将关联规则分成分析关联规则和挖出布尔型规则是根据规则处置值类型分类的;将关联规则分成序列模式挖出、频密项集挖出以及结构模式挖出是根据俄关联规则挖出模式展开分类的;将关联规则分成兴趣度约束、科学知识类型约束、数据约束,是根据规则所挖出的约束类型分类的。关联规则挖出算法分析1Apriori算法分析关联规则算法中的挖出几乎频密项集中于,Apriori算法该类型中最具备应用于价值,影响力仅次于的算法。Apriori算法主要有两个步骤:(1)找到所有的频密集;(2)分解强劲关联规则。

在Apriori算法中的第一步是尤为最重要的步骤,该算法的核心思路是,等价一个数据库,在第一次数据库扫瞄中找到所有反对度小于相等大于反对度的项目构成频密1—项集,也就是L1,1—项集C1,由L1展开相连获得;接着展开第二次数据库扫瞄,将C1中所有反对度小于相等大于反对度的项集构成频密2—项集,也就是L2,候选2—项集C2由L2相连获得。以此类推,直到找到仅次于项频密集。即在展开第N次数据库扫瞄时,找到CN-1中所有反对度小于相等大于反对度的项集构成频密N—项集,即是LN,N—项集CN要由LN相连得出结论,仍然到敢说新的全集为止。

在这里还要中用Apriori算法性质,即是频密项集是频密项集的子集,非频密项集所谓频密项集的超集。在Apriori算法中对数据库的扫瞄次数必须小于仅次于频密项集的项数。Apriori算法的操作者具备两个显著的缺点:(1)该算法的用于必须对数据库展开多次扫瞄,因此在读写操作上不会花费很多的时间,从而减少挖出算法的时间成本,这种成本的减少不可小觑,因为它是有数据库存储数据的减少,以几何级数下降的成本;(2)Apriori算法不会经常出现众多的候选频密集,时有发生集的产生量在每一步都相当大,这不会使算法在普遍度和了解度上的适应性较好。2FP—growth算法分析FP—growth算法是关联规则算法中归属于深度优化的一种算法,这种算法是深度优化算法中较新的且具备较高效益的,不同于Apriori算法本质的常用算法。

FP?—growth算法的基本基本步骤有两个:(1)再行将频密模式树FP—tree分解;必须将项集关联信息保留住,并使用一棵频密模式树根(FP—tree)用来容纳传输后的数据库;(2)在分解的FP—tree频密模式树中搜寻频密项集:再行将传输后的FP—tree再行集中为几个小的条件数据库,再行分别对这些数据库展开信息挖出。FP—growth算法相比于Apriori算法,只必须对数据库展开两次扫瞄,不必须多次扫瞄,大幅增加了挖出算法的时间成本;也会经常出现大量的候选项集,大幅增加了频密集的搜寻空间。

金沙官网首页

也就是说FP—growth算法能明显提高时间和空间效率。但是该算法也有缺点,在对可观且牢固的数据库展开挖出处理过程中,不管是递归计算还是信息挖出都必须占有大量的空间。

两种算法都还不存在各自必须改良缺点,怎样在挖出过程中提升挖出效率,符合人们对挖出系统的市场需求,这将是数据研究工作者依然必须突破的重难点。


本文关键词:金沙官网首页,数据挖掘,中的,关联,规则,挖掘,算法,关联

本文来源:金沙官网首页-www.doghillfarmvt.com

同类文章排行

最新资讯文章

Copyright © 2001-2023 www.doghillfarmvt.com. 金沙官网首页科技 版权所有  http://www.doghillfarmvt.com  XML地图  js金沙(中国)股份有限公司官网