我正在尝试建立完全连接的网络来进行 分类任务,而我的训练数据包含一些缺失 值和缺失位置不是固定的。
例如:
[x1, x2, NaN, x4, x5] [y]
[x1, x2, x3, x4, NaN] [y]
[NaN, x2, x3, NaN, x5] [y]
我试图实现一些方法来填写缺失值 但毕竟会带来偏差。
为解决偏见问题,我计划保留缺失之处,但
删除缺失值出现在相应节点中
输入层,这样NaNs
就不会馈入网络并导致
错误,并且网络的以下各层保持不变。我想知道
如果有在PyTorch中实现此目标的特定方法,可以通过以下方式实现:
但是,这些只是我可以提出的两种可能的解决方案, 如果您可以与我分享其他有用的方法,将不胜感激。