分类模型的训练集中是否应包括两个从属特征?

时间:2018-06-28 19:08:51

标签: machine-learning

我刚刚开始数据科学之旅,所以如果问题很愚蠢,请原谅我。如果在数据集中有两个相互依赖的列,例如“ fare”和“ type_of_seat”。那么,我们应该将这两个功能都包含在训练集中还是只包含其中一个才能完成工作?

1 个答案:

答案 0 :(得分:0)

依赖性有多强?换句话说,通过同时包含两个功能,您是否可以获得任何信息?如果可以直接从另一个中计算出一个(如您的示例,我怀疑可以直接从type_of_seat推断票价),那么您将不会获得任何收益,并且可以忽略其中一个功能,因为它们是多余的。