我正在尝试从PDF中提取突出显示的文本。为此,我想创建一个内容为突出显示文本的注释,然后使用Adobe的“创建注释摘要”功能获取提取的突出显示文本。
我发现一个example通过adobe的javascript sdk执行此操作,但是代码有错误。
假设我只看第一个注释:
var annots = this.getAnnots({nSortBy: ANSB_Page});
var fblock = annots[0];
console.println(fblock.quads)
组成突出显示部分的6个四边形:
我还找到了第一个四边形边界的相应单词:
我该如何比较这些坐标并确定一个单词是否在四边形内?似乎没有图案,但我不是几何专家。我应该在math.stackexchange上问这个问题吗?
我也查看了this的答案,但是我是java的新手,所以我不确定如何使用代码段。理想情况下,我想用javascript解决此问题。