与MNIST类似的研究数据集

时间:2013-03-23 08:38:26

标签: machine-learning mnist

我正在研究机器学习。现在我想用一些着名的数据集来测试我的算法。由于我是这个领域的新人,除了MNIST之外,我找不到其他合适的数据集。我的东西MNIST非常适合我们的研究。有没有人知道一些与MNIST类似的数据集?非常感谢你!

P.S我知道另一个经常使用的手写数字数据集,称为USPS数据集。但我需要一个包含更多训练样例的数据集(通常超过10000,与MNIST中的训练样例数相当),因此USPS不在我的选择范围内。

2 个答案:

答案 0 :(得分:3)

机器学习档案(http://archive.ics.uci.edu/ml/)包含各种各样的数据集,包括适用于分类的MINIST等数据集。 (http://archive.ics.uci.edu/ml/datasets/Skin+Segmentation)。

我不知道在不知道你试图用你的算法演示什么的情况下哪些是合适的,但UCI档案中的任何内容都是众所周知的。

答案 1 :(得分:1)

您可以尝试Fashion MNISTKuzushiji MNIST,这些属性与MNIST的属性非常相似,但难以预测。从时尚MNIST的页面:

很抱歉,我们正在谈论取代MNIST。这里有一些很好的理由:

  • MNIST太简单了。卷积网络在MNIST上可以达到99.7%。经典的机器学习算法也可以轻松达到97%。查看我们的Fashion-MNIST与MNIST的并行基准测试,并阅读“大多数MNIST数字对可以通过一个像素很好地区分。”
  • MNIST被过度使用。在2017年4月的Twitter线程中,Google Brain研究科学家和深度学习专家Ian Goodfellow呼吁人们远离MNIST。
  • 深度学习专家/ Keras作者FrançoisChollet在2017年4月的Twitter帖子中指出,
  • MNIST无法代表现代CV任务。