我在应用程序领域遇到一个一般性问题。数据包含一个高维特征空间且样本量很小。一个稀疏网络,其节点具有不同的特征,因此网络具有边。边越大,边越大这对特征具有的相关性或依赖性。 一般来说,我如何在模型中使用网络信息?
目前我在文献中进行搜索。我发现一般方法包括: 1.网络嵌入。利用网络信息获得功能的嵌入。 2.图形神经网络。类似于GCN(图形卷积神经网络)或GAT(图形注意力神经网络)或其他消息传递神经网络。
问题是,数据科学家可以尝试使用哪些功能的网络信息的一般方法是什么?网络不是在不同的样本上,而是在功能上。
答案 0 :(得分:0)
我想到的第一件事是使用网络检查特征相关性,并在训练之前删除高度相关的特征。