机器学习,特征工程和演示模型的常用技术有哪些?

时间:2017-10-20 03:02:40

标签: python machine-learning visualization

我正在使用ML语言识别项目(Python),需要具有高维特征输入的多类分类模型。

目前,我所能做的就是通过追踪错误来提高准确性。无意识地结合可用的特征提取算法和可用的ML模型,看看我是否幸运。

我在问是否有一个普遍接受的工作流程可以系统地找到ML解决方案。

这个想法可能很幼稚,但我在想,如果我能以某种方式可视化那些高维数据和我的模型的决策边界。希望这种可视化可以帮助我做一些调整。在MATLAB中,经过训练后,我可以在所有特征中选择任意两个特征,MATLAB将相应地给出决策边界。我可以用Python做到这一点吗?

此外,我正在寻找一些类型的图表,我可以在演示文稿中使用它来介绍我的模型和功能。该领域最常用的图表是什么?

谢谢

1 个答案:

答案 0 :(得分:1)

特征工程更多的是艺术而非技术。这可能需要领域知识,或者您可以尝试添加,减去,分割和乘以不同的列以从中创建特征并检查它是否为模型增加了价值。如果使用线性回归,则调整后的R平方值必须增加,或者在树模型中,您可以看到要素重要性等。