编写脚本将图像转换为带引用和脚注的文本?

时间:2014-10-06 12:55:45

标签: ocr

我有一堆数百张纸组成一本书。物理副本包括书籍的文本,文本中的参考文献以及几乎每页底部的脚注(及其各自的参考编号)。但是,我只有一个文档包含该书的文本,而且每个脚注都有一个单独的文档,由换行符分隔。没有包含带引用和脚注的文本的文档。

我需要通过参考他们在实体副本上的位置将脚注放在文本文档中的适当位置。有没有办法实现自动化?我正在考虑扫描每一页并使用OCR工具将扫描的图像转换为文本,但我想知道软件是否会提取参考文献。

如果无法做到这一点,有没有人找到解决这类问题的方法?我想避免手动操作。

0 个答案:

没有答案