给定与像素值对应的整数文本文件,实现无监督学习算法的最有效方法是什么?

时间:2016-02-12 23:05:14

标签: machine-learning

很抱歉,标题有点模糊,但我想不出更简洁的方式来陈述我的问题。

我有一个大约1500行和256列的.txt文件,取自UCI的机器学习库。每行是256个二进制值的向量,用于表示手写数字图像的16x16缩放版本,即0到9.有关完整说明,您可以阅读其完整说明here

因为我无法看到我正在使用的内容,所以我编写了一个简短的Java程序来从文本文件中绘制每个图像。 Here's其中一个例子,似乎是'5';如果像素为1,程序只会向下移动每一行并为正方形着色。

我想分析这个文本文件,教一个机器学习系统如何识别不同的数字。我正在上大学课程,我们正在学习许多不同的机器学习技巧,但我不确定哪个最适合在这里申请。我考虑过一个无人监督的Hebbian网络,一个隐马尔可夫模型,一个k-means聚类,还有一些其他人,但凭借我有限的知识,我真的不知道哪个是“最好的”(即最容易实现的组合和那个给出最低错误率的方法来解决这个问题。

我可以访问MatLab以及下载了许多开源机器学习库,如NeuroPH,gCLUTO等,但我不确定从哪里开始。分析这个特定数据集的好方法是什么,如果可能,任何人都可以推荐一个特定的库或该系统的实现?谢谢!

0 个答案:

没有答案