用于可视化的HOCR到HTML

时间:2016-07-13 20:35:23

标签: html ocr hocr

如何将hOCR转换为HTML以进行可视化?

如果打开原始hOCR文件,它只会呈现为纯文本(元素未定位)

3 个答案:

答案 0 :(得分:6)

这项任务有不同的解决方案,我知道这三个:

所有这些repos似乎主要包含一些JavaScript和CSS文件。前两个repos都有一个链接到一些演示页面,我从那里拍摄了照片。

第一个提供Greasemonkey / Tampermonkey脚本,允许在任何合适的官方网站上在线和本地注入此覆盖(可能有一些配置)。我不知道将其他solutins用于你自己的特定文件是多么困难,但它应该是可行的。

答案 1 :(得分:4)

要将接口添加到普通的hOCR文件中,请在结束标记之前添加以下行:

<script src="https://unpkg.com/hocrjs"></script>

然后在浏览器中打开html(hOCR)文件。

Source

答案 2 :(得分:-3)

hOCR是HTML。您可以在Web浏览器中查看它。