我有一个具有以下结构的表格数据集:数据集的样本结构:
我已经使用LSTM在数据的最后一列中对14个不同类别的序列进行了分类。最近,我遇到了用于梯度增强的XGBoost,仅在分类方面就给我带来了非常好的准确性(接近97%)。 XGBoost具有feature_importance_方法,该方法提供了一种可视化和查找F1分数的方法,以了解各种功能的重要性,例如。 https://machinelearningmastery.com/feature-importance-and-feature-selection-with-xgboost-in-python/
我想创建一个集成的(混合)模型,将LSTM与XGBoost技术结合起来,以考虑到功能的重要性,并同时使用这两个模型,可以获得更好的准确性(然后评估使用各种指标(例如准确性,精度,召回率,AUC等)进行分类的模型性能。同样,如果模型还可以为特定的预测/分类提供功能重要性,则将很有帮助(例如,如果模型将数据实例分类为属于ClassX,则最好提供例如上面的链接中概述了可能有助于对该类进行特定分类的前10个特征,并且还获得了特征重要性图(可以相应地变化,因为我数据中的特征数量为1970,非常高的维数) ,