我的csv文件包含具有超过400列和日期时间索引的数据框。我想使用均值和标准差(SD)删除每列中的离群值。要删除的行是那些值超出(Mean-2 * SD)和(Mean + 2 * SD)的行。
对于单列,我可以使用以下代码列出要保留的数据:
dat <- read.table ("column.txt", header = T, row.names = 1)
我的问题:如何通过单个python镜头对整个df进行处理,仅返回最终的inliers df,并保持原始表格式具有datetime索引和列。
到目前为止发现的其他文章都涉及单个数组。