使用python中的均值和标准差删除许多列中的离群值

时间:2018-12-07 18:34:10

标签: python dataframe outliers

我的csv文件包含具有超过400列和日期时间索引的数据框。我想使用均值和标准差(SD)删除每列中的离群值。要删除的行是那些值超出(Mean-2 * SD)和(Mean + 2 * SD)的行。

对于单列,我可以使用以下代码列出要保留的数据:

dat <- read.table ("column.txt", header = T, row.names = 1)

我的问题:如何通过单个python镜头对整个df进行处理,仅返回最终的inliers df,并保持原始表格式具有datetime索引和列。

到目前为止发现的其他文章都涉及单个数组。

0 个答案:

没有答案