oracle odm:关联规则增加不同值的最大数量

时间:2013-05-24 21:36:37

标签: oracle11g data-mining

我正在使用Oracle Data挖掘机 在我的工作流程中,我正在加入两个表格。在产品密钥上连接的销售表和产品表。 以下是我的分析中的以下细节:

交易ID - 单号ID,位置销售ID 项目ID - 产品密钥 价值 - 班级名称

以下工作正常,但类名仍然过于笼统,无法获得有关产品的有意义信息。

如果我执行以下操作:

交易ID - 单号ID,位置销售ID 项目ID - 产品密钥 值样式名称(它是产品表的一部分)

我得到的错误信息是: 项值属性样式名称具有太多不同的值。允许的最大不同值数是10

如何增加不同值的最大数量(无限值会很好,因为有些表有100百万条记录)。

我真的不明白为什么必须有这个限制。有人可以向我解释一下吗?

我使用的是sql developer 3.2.20.09 和高级分析版本11.2.0.3.0

提前致谢!

1 个答案:

答案 0 :(得分:0)

您可能使用了太多数据。

将项目值等数值数据提供给关联规则挖掘。

关联规则挖掘应该找到诸如

之类的规则
buys diapers  ->  also buys beer

对于这些算法,您需要的记录只包含产品类别,而不需要其他内容。你通常甚至不想知道这个(都市神话)玩具例子的尿布或啤酒品牌。即您希望输入数据如下:

diapers baby-food spaghetti tomatos
diapers beer
diapers baby-food beer
spaghetti tomatos cheese

其中每一行包含在一次交易中一起购买的产品类别。

然后将关联规则之后后处理到例如检查他们贡献了多少价值,或者是否只有一个特定的品牌(即当他们被送到超市购买尿布时,他们会更喜欢最便宜或优质的啤酒)

如果没有抽象产品类别,您的结果可能不会很重要(即您找不到任何东西)。