我试图找到一种可以接受类似训练输入的算法:
{1.1,2.3,3.5} - > "富" {4.7,5.9,6.1} - > "杆"
第一部分是数据,第二部分是我自己分配的类别标签。我的想法是,当我输入新的数据点时,它应该能够猜出正确的标签。
我已经实施了朴素贝叶斯(虽然到目前为止我只用通常的{红色,圆形} - >"苹果"东西来测试它,但是我开始认为将数值数据离散化为布尔(统计)事件并不是特别容易或可能产生良好结果(如果我错了,请纠正我!)。我喜欢它的东西(天真的贝叶斯)是它非常简单,实际上我可能会有很多适合事件的数据。
所以我的问题是,您能说出一些可以直接使用数字数据的机器学习算法吗?或者,或者,我如何有效地将浮点数据离散化为事件(用于例如Naive Bayes)?
其他信息:我也为这个项目实现了k-means(它输出的质心实际上当前是数据的来源),但我对此感兴趣的并不是简单的聚类,而是将智能标签/类别附加到数据并将这些标签传授给机器。