我的数据具有以下方面:
h=df1.iloc[[2]]
output:
action_query 10424567
Day
2017-09-20 0
2017-09-21 0
2017-09-22 0
2017-09-23 2
2017-09-24 0
2017-09-25 0
2017-09-26 1
2017-09-27 0
我想根据过去几天的行为,为每个action_query应用异常检测(椭圆包络)。但是当我运行上面的确切数据时,它返回以下错误:
from sklearn.covariance import EllipticEnvelope
outliersfin=[]
for i in range(len(df1)):
Elliptic= EllipticEnvelope(contamination=0.0010)
h=df1.iloc[[i]]
h1=h.transpose()
Elliptic.fit(h1)
outliers= Elliptic.predict(h1)
outlierfin.append(outliers)
ValueError: Input contains NaN, infinity or a value too large for dtype('float64')
所有值都采用int格式,所以这不是问题。
h.dtype()
Day int64
action_query int64