我的列表中有n个数据帧
df=[df_1, df_2, df_3, ...., df_n]
其中df_n是熊猫(python)中的数据帧。 df_n是我的keras模型的变量。
X_train=[df_1_1,df_2_1,...,df_n_1]
位置:
df_1_1是列表的第一个数据框(第一个变量)和该数据框的第一列,他的数据框有m列。
此数据框的每一列,如果此变量应用了不同类型的平滑或过滤器。
每个数据帧中有100列,我想选择(不同数据帧的)列的组合,即X_train,而不是模型得分中的最小值。
score = model.evaluate(X_test,Y_test)
X_test和Y_test是所选列的最后n次出现。
有一些用于选择此列的库(神经网络,GA,蚁群蚁群...)?
我该如何实施?
答案 0 :(得分:0)
您的预测任务是什么?您是否需要神经网络?您实际上是在这里查看功能选择问题。您可以使用更简单的模型,例如套索,该套索将使用L1正则化选择列。或者,您可以使用诸如随机森林之类的集成技术,并考虑相对要素的重要性以选择列。也许看看scikit-learn。