随机特征映射

时间:2017-10-23 08:29:59

标签: machine-learning logistic-regression

我正在学习机器学习课程在练习2的第二部分,我们应该使用特征地图。并且他们通过将特征映射到x1和x2的所有多项式项以及最大六次幂来添加新功能。但是,我的导师告诉我,我不应该使用这个算法,而应该随机添加功能。但是,我们添加了新功能以便更好地进行分类。因此,不会随意添加功能使这更复杂?那么我们可以随机添加功能还是应该遵循一些规则?

1 个答案:

答案 0 :(得分:3)

添加新要素(例如现有要素的多项式)有助于通过使用复杂假设来减少错误。但这可能会导致训练数据过度拟合,并且可能无法在测试集上产生有效的结果。

因此,为了添加新功能,应考虑以下内容:

1)通过分析结果手动选择要保留的功能。

2)其他方式是使用所有特征,然后使用正则化,这将自动减少对较少贡献特征的重要性,并更加重视对目标变量的更多贡献特征。

3)随机选择功能可能总是有用,也可能没有用。总是需要选择那些对目标变量贡献更多的特征。随机选择可能不是合适的解决方案。

重要提示

始终使用验证集检查培训期间的错误。 在处理多项式特征时,请始终检查学习曲线,以确定模型不应过度拟合列车数据。如果发生这种情况,请尝试增加正则化参数(lambda)。正则化有助于减少过度拟合。