使用带有scikit-learn ML算法的float64数据类型是否合适?

时间:2015-02-24 21:23:03

标签: python machine-learning scikit-learn classification decision-tree

我正在尝试使用scikit-learn为给定here的数据集执行决策树和SVM。我的目的是比较这两种算法,以便我对两种算法使用KFold交叉验证方法并显示差异。但我使用的数据集包含0.00057之类的实数。我得到准确性,我可以说没有过度拟合,但我不确定实数会影响结果。

给scikit-learn内置分类函数实数是一个问题吗?如果是,我该怎么做才能获得更好的结果呢?

PS:当我在python中检查单个数据的类型时,我看到它是float64。

1 个答案:

答案 0 :(得分:2)

DecisionTreeClassifier和SVC在内部使用float32来表示功能。他们会将任何输入数据转换为这种格式。对于机器学习任务,这通常足够精确。