我试图用SciKitLearn构建决策树,它告诉我: 输入包含NaN,无穷大或对于dtype来说太大的值(' float64')。
对输入数据运行.isnull()。any()会为每列返回False。
有四个类型为float64的输入列;它们中的数据被正确格式化为两位小数,没有疯狂的值。
罪魁祸首是什么?如何解决?
y = df["CutoffValue"]
X = df_new
clf = tree.DecisionTreeClassifier()
clf = clf.fit(X,y)
答案 0 :(得分:0)
修正了它!在这种情况下,错误中的“输入”是指LABELED数据,y!删除列的空值,一切正常。