应用错误收集

我试图找到一种可以接受类似训练输入的算法：

{1.1,2.3,3.5} - ＆gt; ＆＃34;富＆＃34; {4.7,5.9,6.1} - ＆gt; ＆＃34;杆＆＃34;

第一部分是数据，第二部分是我自己分配的类别标签。我的想法是，当我输入新的数据点时，它应该能够猜出正确的标签。

我已经实施了朴素贝叶斯（虽然到目前为止我只用通常的{红色，圆形} - ＆gt;＆＃34;苹果＆＃34;东西来测试它，但是我开始认为将数值数据离散化为布尔（统计）事件并不是特别容易或可能产生良好结果（如果我错了，请纠正我！）。我喜欢它的东西（天真的贝叶斯）是它非常简单，实际上我可能会有很多适合事件的数据。

所以我的问题是，您能说出一些可以直接使用数字数据的机器学习算法吗？或者，或者，我如何有效地将浮点数据离散化为事件（用于例如Naive Bayes）？

其他信息：我也为这个项目实现了k-means（它输出的质心实际上当前是数据的来源），但我对此感兴趣的并不是简单的聚类，而是将智能标签/类别附加到数据并将这些标签传授给机器。

用于数字/连续n维数据的机器学习算法

0 个答案: