我正在尝试使用scikit-learn将高斯过程拟合到某些数据,但相关模型的超参数的最大似然估计失败了:
Exception: Bad parameter region. Try increasing upper bound
现在我怀疑这是因为我的数据集中出现了一些巨大的“峰值”(我不愿称它们为异常值,因为它们可能是真值) - 请参阅下图(右图直方图):
因此,在我的脑海中,解决方案是强制最大似然优化器仅在1-99百分位数据上进行优化,以忽略此峰值。但是,我没有任何理由(或代码),并且有点想知道是否有任何意见,如果这是有道理的。
可能更一般地说:对超参数进行“稳健”最大似然估计是否有意义?