我正在使用Oracle Data挖掘机 在我的工作流程中,我正在加入两个表格。在产品密钥上连接的销售表和产品表。 以下是我的分析中的以下细节:
交易ID - 单号ID,位置销售ID 项目ID - 产品密钥 价值 - 班级名称
以下工作正常,但类名仍然过于笼统,无法获得有关产品的有意义信息。
如果我执行以下操作:
交易ID - 单号ID,位置销售ID 项目ID - 产品密钥 值样式名称(它是产品表的一部分)
我得到的错误信息是: 项值属性样式名称具有太多不同的值。允许的最大不同值数是10
如何增加不同值的最大数量(无限值会很好,因为有些表有100百万条记录)。
我真的不明白为什么必须有这个限制。有人可以向我解释一下吗?
我使用的是sql developer 3.2.20.09 和高级分析版本11.2.0.3.0
提前致谢!
答案 0 :(得分:0)
您可能使用了太多数据。
不将项目值等数值数据提供给关联规则挖掘。
关联规则挖掘应该找到诸如
之类的规则buys diapers -> also buys beer
对于这些算法,您需要的记录只包含产品类别,而不需要其他内容。你通常甚至不想知道这个(都市神话)玩具例子的尿布或啤酒品牌。即您希望输入数据如下:
diapers baby-food spaghetti tomatos
diapers beer
diapers baby-food beer
spaghetti tomatos cheese
其中每一行包含在一次交易中一起购买的产品类别。
然后将关联规则之后后处理到例如检查他们贡献了多少价值,或者是否只有一个特定的品牌(即当他们被送到超市购买尿布时,他们会更喜欢最便宜或优质的啤酒)
如果没有抽象产品类别,您的结果可能不会很重要(即您找不到任何东西)。