从关闭的频繁项目集生成计数

| 我正在阅读似乎在说的笔记:给定所有已关闭的频繁项目集的收集及其支持计数,可以获得任何频繁项目集的支持计数。 如果没有更大的项目集正确包含并且包含一个频繁的项目集,则将其称为关闭 相同的支持计数。 试图证明这一点,但无法解决。 以下是一些有关关联规则挖掘的定义的链接: 关联规则挖掘     
已邀请:
封闭项目集X是不包含在具有相同支持的另一个项目集中的项目集。 X中包括的所有具有相同支持的项集Y1,Y2,Y3..YN都称为相同的等效类。它们不是封闭的项目集,因为它们包含在具有相同支持(X)的较大项目集中。 现在,假设您拥有所有频繁关闭的项目集C的集合,并且您想知道项目集F的支持。 您需要做的非常简单。您需要将F与所有经常关闭的项目集进行比较。您必须找到最小的封闭项目集W,使得W包含F。然后F的支撑就是W的支撑。 如果您想了解有关封闭项目集的更多详细信息,我建议阅读Pasquier的论文: http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=7956B5A50ED076203227367503FA7958?doi=10.1.1.37.1102&rep=rep1&type=pdf 如果您想要一些算法源代码来挖掘封闭项集,则可以检查我的Java项目: http://www.philippe-fournier-viger.com/spmf/ 它提供AprioriClose和DCI_Closed。     
您知道没有哪个集合比其子集具有更高的支持...因此,任何给定项目集的支持都等于最频繁的超集的支持: sup(x)= max {y.support | y是x的超集,y是封闭的频繁项集} 给定封闭的频繁项目集及其支持,存在一种算法可产生对所有项目集的支持:
kmax = size of largest closed itemset
Fmax = closed frequent itemsets of size kmax
for k = kmax downto 1 do
    Fk = {f | f immediate subset of f\' in Fk+1 or f is closed | |f|=k}
    for every f in Fk do
        if f is not closed
            f.support = max{f\'.support | f\' in Fk+1 , f\' is a superset of f}
        endif
    endfor
endfor
资料来源:http://www.cs.helsinki.fi/group/bioinfo/teaching/dami_s10/dami_lecture4.pdf     

要回复问题请先登录注册