我正在尝试使用最小方差过滤器(机器学习)技术来降低尺寸。我试过的代码是-
numeric=dataset
var = numeric.var()
numeric = numeric.head(0)
variable = []
for j in range(0,len(var)):
if var[j]>=10: #setting the threshold as 10%
variable.append(numeric[j+1])
错误是- KeyError:1
由于我没有使用任何词典,因此错误是什么意思,我该如何纠正。
答案 0 :(得分:2)
问题是您正在尝试访问数据框上不存在的索引。
variable.append(numeric[j+1])
如果您要保留方差大于给定阈值的列,只需删除+ 1:
variable.append(numeric[j])
此外,如果您只对列的索引感兴趣,还可以添加以下修改:
numeric = numeric.head(0)
到
numeric = numeric.columns
答案 1 :(得分:0)
您首先要获取数据框的第一行。
numeric = numeric.head(0)
然后在下面的行中迭代range(0, len(var))
variable.append(numeric[j+1])
由于在代码第三行之后的数字数据框中只有一行,所以索引只有0。因此,我猜是错误。
有关