声明性数据挖掘:频繁项集平铺

时间:2013-02-19 17:12:15

标签: data-mining declarative constraint-programming

对于我的计算机科学研究课程,我必须提出一组约束和分数定义来找到频繁项目集挖掘的平铺。具有数据的矩阵由1和0组成。

我的任务是为平铺提供一组约束(具有固定数量的平铺),以及需要最大化的分数函数。自从我开始研究允许重叠切片的解决方案以来,我试图找到一个得分函数来计算所有切片的总“面积”。请记住,必须针对每个可能的解决方案评估得分函数,因此我不能简单地检查总矩阵(其包含大约100k个元素)并查看它是否是图块的一部分。 但是,我只考虑了2个瓷砖之间的重叠,并提出了以下内容:

TotalArea = Sum_a_in_Tiles(区域(a)) - Sum_a / b_in_tiles(重叠(a,b))

愚蠢的我,我没有考虑3个瓷砖之间可能的重叠。我的问题如下: 是否有可能为n个图块提出一个通用的得分函数,只考虑每个图块的面积和2个(或更多)图块之间每次重叠的面积,如果是,我将如何编程呢?

我可以提供一些代码,但是它必须再用一些名为Comet的晦涩语言进行编程:(

0 个答案:

没有答案