如何在AutoML之前使用流接口应用PCA

时间:2019-10-28 01:46:03

标签: h2o

我不是一个熟练的程序员。一直在使用流用户界面来尝试在autoML中构建一些模型。

我了解到,开源软件在调整功能方面没有多大作用,因为该功能留给了商业产品。

我想知道,我可以使用流程界面采取简单的步骤来帮助改进功能吗?

例如,我有一个数据集,具有800种功能。我认为其中许多是重复/相关的。

是否可以通过使用内置在流程中的PCA模型来减少/折叠这些内容?

如果是这样,有人可以提供一些有关如何操作的提示/步骤吗?我不确定如何实现此目标?

我认为它会是这样的:

加载火车数据集->创建pca模型->使用pca模型减少功能数量->对生成的数据集运行autoML

然后

如何将其应用于测试数据集?

这有意义吗?

谢谢!

0 个答案:

没有答案