ValueError: array must not contain infs or NaNs in SpectralCoclustering
我试图获得数据集的双聚类,范围为(-1.0,1.0)。在我的数据中,我没有任何inf或nan。但它会引发npm i
的错误。你能帮我么?我需要一个范围(-1,1)的数据集,所以我不想在正范围内更改它。
答案 0 :(得分:1)
我花了两天时间搞清楚同样的问题。我的解决方案:在执行model.fit(input)
之前,我删除了input
中只有零的列:
remaining_collumns=input.getnnz(1)>0
input=input[remaining_collumns,:]
model.fit(input)
另请注意,在我的情况下input
由TfidfVectorizer.fit_transform
返回,并且格式为sparse.csr.csr_matrix