我不是一个熟练的程序员。一直在使用流用户界面来尝试在autoML中构建一些模型。
我了解到,开源软件在调整功能方面没有多大作用,因为该功能留给了商业产品。
我想知道,我可以使用流程界面采取简单的步骤来帮助改进功能吗?
例如,我有一个数据集,具有800种功能。我认为其中许多是重复/相关的。
是否可以通过使用内置在流程中的PCA模型来减少/折叠这些内容?
如果是这样,有人可以提供一些有关如何操作的提示/步骤吗?我不确定如何实现此目标?
我认为它会是这样的:
加载火车数据集->创建pca模型->使用pca模型减少功能数量->对生成的数据集运行autoML
然后
如何将其应用于测试数据集?
这有意义吗?
谢谢!