扫描的文档和数据库查询

时间:2014-03-04 17:51:20

标签: comparison ocr catalog bibliography

我正在开展一个项目,要求我将打印参考书目(近14000项)与数字目录/数据库进行比较。是否有可能 1.扫描参考书目​​, 2.通过OCR程序运行它, 3.(可选)将扫描的文件转换为电子表格 4.将该信息与图书馆目录进行比较,即查看参考书目中的项目是否出现在目录集中?

这将大大减少该项目目前所需的时间。

1 个答案:

答案 0 :(得分:0)

是的,这绝对是可能的。

这是一个有趣的项目,很不寻常,需要一些MacGyvering。

您描述的步骤是正确的。请记住,对于OCR结果的最大自动化计划并不完美,因此您的搜索算法应该允许一些灵活性和模糊性,足以容纳来自OCR的偶然错误,但具体到不会导致误报。