培训文本检测系统

时间:2015-09-04 14:28:02

标签: machine-learning dataset ocr

我目前正在使用逻辑回归在给定图像中开发文本检测系统,我需要训练数据,如下图所示:

enter image description here

第一列显示文本的正例(y = 1),第二列显示没有文本的图像(y = 0)。

我想知道在哪里可以获得这种标记数据集?

提前致谢。

2 个答案:

答案 0 :(得分:3)

UC Irvine机器学习库是开始这些事情的好地方: http://archive.ics.uci.edu/ml/

但是也可以考虑转向交叉验证,与机器学习相关的问题:

https://stats.stackexchange.com/

答案 1 :(得分:2)

您可以获得类似的数据集here

希望它有所帮助。