Question

我的列表中有n个数据帧

df=[df_1, df_2, df_3, ...., df_n]

其中df_n是熊猫（python）中的数据帧。 df_n是我的keras模型的变量。

X_train=[df_1_1,df_2_1,...,df_n_1]

位置：

df_1_1是列表的第一个数据框（第一个变量）和该数据框的第一列，他的数据框有m列。

此数据框的每一列，如果此变量应用了不同类型的平滑或过滤器。

每个数据帧中有100列，我想选择（不同数据帧的）列的组合，即X_train，而不是模型得分中的最小值。

score =  model.evaluate(X_test,Y_test)

X_test和Y_test是所选列的最后n次出现。

有一些用于选择此列的库（神经网络，GA，蚁群蚁群...）？

我该如何实施？

Answer 1

您的预测任务是什么？您是否需要神经网络？您实际上是在这里查看功能选择问题。您可以使用更简单的模型，例如套索，该套索将使用L1正则化选择列。或者，您可以使用诸如随机森林之类的集成技术，并考虑相对要素的重要性以选择列。也许看看scikit-learn。