熊猫数据框中的选择列套用min函数

时间:2018-08-17 11:22:05

标签: pandas keras genetic-algorithm variable-selection

我的列表中有n个数据帧

df=[df_1, df_2, df_3, ...., df_n]

其中df_n是熊猫(python)中的数据帧。 df_n是我的keras模型的变量。

X_train=[df_1_1,df_2_1,...,df_n_1]

位置:

df_1_1是列表的第一个数据框(第一个变量)和该数据框的第一列,他的数据框有m列。

此数据框的每一列,如果此变量应用了不同类型的平滑或过滤器。

每个数据帧中有100列,我想选择(不同数据帧的)列的组合,即X_train,而不是模型得分中的最小值。

score =  model.evaluate(X_test,Y_test)

X_test和Y_test是所选列的最后n次出现。

有一些用于选择此列的库(神经网络,GA,蚁群蚁群...)?

我该如何实施?

1 个答案:

答案 0 :(得分:0)

您的预测任务是什么?您是否需要神经网络?您实际上是在这里查看功能选择问题。您可以使用更简单的模型,例如套索,该套索将使用L1正则化选择列。或者,您可以使用诸如随机森林之类的集成技术,并考虑相对要素的重要性以选择列。也许看看scikit-learn