何时必须使用过滤器将数据类型更改为名义?我现在正在进行分类,如果我把它改成名义上的,那么结果相差很大。提前谢谢。
答案 0 :(得分:0)
我的问题不是很好,但无论如何我都会尽力回答。
标称和数字属性表示不同类型的属性,因此机器学习算法会对它们进行不同的处理。
名义属性仅限于一组封闭的值,并且它们之间没有顺序或任何其他关系。通常,名义属性应该具有少量可能的值(大的可能值集可能导致过度拟合)。汽车的颜色是可能表示为名义属性的属性的示例。
数字属性通常更常见。它们代表某些轴上的值,并不限于特定值。通常,分类算法将尝试在该轴上找到在类之间很好地区分的点,或者使用该值来计算实例之间的距离。员工的工资是我可能用作数字属性的属性的示例。
您需要考虑的另一件事是分类算法如何处理名义和数字属性。有些算法不能很好地处理名义属性。如果属性的值未规范化,则其他算法不适用于多个数字属性。