如何在Excel中清理数据,特别是删除超出给定范围的极端异常值?

时间:2017-08-14 22:50:50

标签: excel data-scrubbing

我有数千个从模型输出的数据单元格,我的结果格式如下:单元格ID是列标题,每行是一个时间步长,每个单元格的结果打印数百次在电子表格中。我想分析某些百分位数内的数据。我已经确定了感兴趣的百分位阈值的值,但我没有找到关于如何...的明确指示。

a)删除我感兴趣的范围之外的所有值,对于我在

工作的工作表

b)将感兴趣范围内的值拉出纸张,然后分成单独的值进行进一步分析

值是带小数点后两位的数字。

我需要在单独的步骤中清理数据,然后对其进行分析。例如,即使在时间序列中移除了极限最大值和最小值之后,我仍然希望看到整个时间序列,但删除了异常值或将其更改为空值。 如何从此数据矩阵中选择或删除所有异常值,将其余数据保留在原因中?

2 个答案:

答案 0 :(得分:2)

最好的方法是使用数据透视表功能。

使用数据透视表,您将能够使用范围(主数据和异常值)创建过滤器参数。

如果您不知道如何使用数据透视表,请查看此内容: Create a PivotTable to analyze worksheet data

答案 1 :(得分:1)

虽然"健壮"最简单的方法是过滤数据。之后,过滤掉所有的好价值。一旦你只有"坏"细胞可见,然后转到特殊细胞,仅突出显示可见细胞。从那里,删除。

为了有效地/使用键盘快捷键,它会是这样的:

  • 1)选择数据标题并输入alt + h + s + f
  • 2)点击"值"标题,然后单击正确的数字,直到您拥有不想过滤的所有数据。
  • 3)突出显示所有剩余的单元格(这些应该是您要删除的数据点,excel中的行号现在应该是蓝色)
  • 4)键入alt + h + f + d + s + y转到特殊区域并仅选择可见的单元格
  • 5)输入alt + h + d + r删除行(这需要一点时间,耐心等待)

我希望它有效!

***编辑:您也可以根据大小排名,而不是手动整理数据,直接删除数据。在更多地考虑答案之后,这种方法会更容易(我认为)并且更快。