美国人口普查的OCR 1930年

时间:2013-01-29 21:53:31

标签: image-processing machine-learning ocr

1930年的美国人口普查可在线获取,作为一系列大型pdf。可悲的是,据我所知,没有免费服务也在其上运行OCR。另一方面,有许多在线“热情的业余爱好者”成功完成OCR的例子。所以,让我们从头开始吧。

例如,可以在http://i47.tinypic.com/2i7tt8k.png看到单个页面,这是另一个页面:

enter image description here

从图像中提取不同的单词以便开始尝试训练系统识别它们的好方法是什么?最终我认为这是一个棘手的机器学习问题。

您可以从http://archive.org/details/newyorkcensus00reel1475和相关链接下载整个图像文件。

0 个答案:

没有答案