如何将hOCR转换为HTML以进行可视化?
如果打开原始hOCR文件,它只会呈现为纯文本(元素未定位)
答案 0 :(得分:6)
这项任务有不同的解决方案,我知道这三个:
https://github.com/kba/hocrjs(覆盖图像上的特定数据,不同的选项如何显示)
https://github.com/not-implemented/hocr-proofreader(显示左侧的图像和右侧的特定数据,可用于输入更正)
所有这些repos似乎主要包含一些JavaScript和CSS文件。前两个repos都有一个链接到一些演示页面,我从那里拍摄了照片。
第一个提供Greasemonkey / Tampermonkey脚本,允许在任何合适的官方网站上在线和本地注入此覆盖(可能有一些配置)。我不知道将其他solutins用于你自己的特定文件是多么困难,但它应该是可行的。
答案 1 :(得分:4)
要将接口添加到普通的hOCR文件中,请在结束标记之前添加以下行:
<script src="https://unpkg.com/hocrjs"></script>
然后在浏览器中打开html(hOCR)文件。
答案 2 :(得分:-3)
hOCR是HTML。您可以在Web浏览器中查看它。