什么是FP-growth允许的输入数据类型?

时间:2017-01-30 21:15:46

标签: c# database sequence data-mining text-mining

我想从我的数据中挖掘频繁的模式。然而,我的数据集非常大。首先,我需要将其转换为事务数据库格式。问题是在我的数据库(500000条记录)中,有402个独特的重复项。我到处都看到fp-growth例子,数据集最多8个字符(A,B,C,D,E,F,G,H),但我需要代表402个独特的项目。我可以为此算法使用字母字符组合吗?还是有其他方法吗? 谢谢你们

1 个答案:

答案 0 :(得分:1)

取决于您的实施。

但允许诸如“牛奶”等项目并且不仅仅是一个字母项目是相当标准的。