我试图通过以下方式聚集超过200k点:
km = KMeans(n_clusters=5)
km.fit_transform(ends)
但是我收到以下错误: km.fit_transform(端)
因此矩阵维度为200kX2
File "/Users/fleh/anaconda/lib/python2.7/site-packages/sklearn/cluster/k_means_.py", line 814, in fit_transform
X = self._check_fit_data(X)
...
ValueError: Input contains NaN, infinity or a value too large for dtype('float64').
据我一直在追踪数据......数字并不大。 我该如何解决? 感谢
答案 0 :(得分:0)
如果您使用pandas进行数据处理,可以运行:
import pandas as pd
df = pd.DataFrame(ends)
df.replace([np.inf, -np.inf], np.nan)
df.info()
info()函数将告诉您是否有任何不可计算的值。