如何对连续数据进行分类?

时间:2012-05-08 10:08:42

标签: machine-learning classification

我有两个依赖的连续变量,我想使用它们的组合值来预测第三个二进制变量的值。我如何对价值观进行离散化/分类?我不是在寻找聚类算法,我特别感兴趣的是获得随后在贝叶斯分类器中使用的“有意义的”离散类别。 对论文,书籍,在线课程的指示非常感谢!

2 个答案:

答案 0 :(得分:0)

这是机器学习的本质,也是研究最多的问题之一。

最小二乘回归,逻辑回归,SVM,随机森林被广泛用于这类问题,称为二元分类。

如果你的目标是对数据进行实用的分类,可以使用几个库,比如scikits-python和java中的weka。他们有很棒的文档。

但是如果你想了解机器学习的内在性,只需搜索(这里或谷歌)机器学习资源。

答案 1 :(得分:0)

如果你想成为一个真正的书呆子,生成一堆不同的可能离散化,然后在其上训练分类器,然后通过特征来表征离散化,然后在其上运行分类器,看看哪种离散化是最好的!?

一般来说,离散化的东西更像是一种艺术,并且对输入变量范围的含义有很好的理解。