决策树通常必须为每个观察(实例)确定结果类(例如阳光,雨,......)。
我想知道是否有任何数据挖掘算法可以根据确定类的属性对实例进行分组。
这是一个例子:
day, outlook, temp, humidity, windy, play
1, sunny, 85, 85, false, no
2, sunny, 80, 90, true, no
3, overcast, 80, 90, true, no
3, rainy, 80, 90, true, no
在这种情况下,我可以使用play或outlook作为结果类。
我的问题是,是否有任何算法或方法可以告诉我,例如outlook是一个我可以用作结果类的属性。
答案 0 :(得分:0)
显然,连续属性不起作用。
但除此之外,任何离散属性都可以起作用。
问题是,您想要做什么,计算机程序将如何知道?
你必须告诉它你的输出是什么,哪些是你的输入。
某些程序当然会应用启发式算法,即如果某个属性被命名为“class”或使用特殊的“class”类型,它将自动被选为输出,余数作为输入。