使用Python进行异常值处理

时间:2018-01-11 20:52:53

标签: validation machine-learning outliers

我是数据科学的新手,在我试图解决的问题上,我对异常检测和处理感到困惑。关于下面数据集的一些见解:

  • 这是一个回归问题
  • 具有数字和分类功能
  • 数字特征包括离散和连续数据列
  • 分类功能主要包括名义和功能;序数据列
  • 我已经完成了缺失值插补和分类数据转换

我被困了,因为我不知道异常值检测和数值数据处理的方法。我要求您提供任何宝贵的帮助,以便继续进行。

如果您想要数字数据的任何快照,请告知我们以便提供解决方案。

我没有添加它,因为它是一个普遍的疑问,因为我甚至不知道如何以及如何使用异常检测和治疗。

1 个答案:

答案 0 :(得分:0)

  1. 绘制数值数据的分布
  2. 您是否看到正态分布或偏态分布?
  3. 如果是正常的话。你可以公平地拿中位数和3 *中位数
  4. 任何值> 3 *中位数被视为异常值。