我正在开展一个项目,要求我将打印参考书目(近14000项)与数字目录/数据库进行比较。是否有可能 1.扫描参考书目, 2.通过OCR程序运行它, 3.(可选)将扫描的文件转换为电子表格 4.将该信息与图书馆目录进行比较,即查看参考书目中的项目是否出现在目录集中?
这将大大减少该项目目前所需的时间。
答案 0 :(得分:0)
是的,这绝对是可能的。
这是一个有趣的项目,很不寻常,需要一些MacGyvering。
您描述的步骤是正确的。请记住,对于OCR结果的最大自动化计划并不完美,因此您的搜索算法应该允许一些灵活性和模糊性,足以容纳来自OCR的偶然错误,但具体到不会导致误报。