我有数千个从模型输出的数据单元格,我的结果格式如下:单元格ID是列标题,每行是一个时间步长,每个单元格的结果打印数百次在电子表格中。我想分析某些百分位数内的数据。我已经确定了感兴趣的百分位阈值的值,但我没有找到关于如何...的明确指示。
a)删除我感兴趣的范围之外的所有值,对于我在
工作的工作表或
b)将感兴趣范围内的值拉出纸张,然后分成单独的值进行进一步分析
值是带小数点后两位的数字。
我需要在单独的步骤中清理数据,然后对其进行分析。例如,即使在时间序列中移除了极限最大值和最小值之后,我仍然希望看到整个时间序列,但删除了异常值或将其更改为空值。 如何从此数据矩阵中选择或删除所有异常值,将其余数据保留在原因中?
答案 0 :(得分:2)
最好的方法是使用数据透视表功能。
使用数据透视表,您将能够使用范围(主数据和异常值)创建过滤器参数。
如果您不知道如何使用数据透视表,请查看此内容: Create a PivotTable to analyze worksheet data
答案 1 :(得分:1)
虽然"健壮"最简单的方法是过滤数据。之后,过滤掉所有的好价值。一旦你只有"坏"细胞可见,然后转到特殊细胞,仅突出显示可见细胞。从那里,删除。
为了有效地/使用键盘快捷键,它会是这样的:
alt + h + s + f
alt + h + f + d + s + y
转到特殊区域并仅选择可见的单元格alt + h + d + r
删除行(这需要一点时间,耐心等待)我希望它有效!
***编辑:您也可以根据大小排名,而不是手动整理数据,直接删除数据。在更多地考虑答案之后,这种方法会更容易(我认为)并且更快。