iOS如何获取PDF页面中的所有单词坐标

时间:2014-06-12 16:29:08

标签: ios pdf nsscanner cgpdfdocument cgpdfscanner

我查看过许多教程,通常会将用户链接到pdfkitten,但是在我测试过的时候,我对结果并不满意。所以搜索不适用于乘法等等。

所以我正在寻找的东西我需要从pdf页面获取所有单词并在单词跨越某个矩形时突出显示它。

1 个答案:

答案 0 :(得分:2)

我使用了PDFKitten。

  • 我在扫描PDF时所做的是 - 识别分隔的单词 按空格。
  • 保存RenderingState(模型在PDFKitten代码中)字是 遇到了用它当前在模型中保存的那个单词 RenderingState(PDFKitten代码中的模型)将是初始状态。 当找到完整的单词(空格分隔)时,再次保存 当前RenderingState为最终状态。
  • 使用将RenderingState转换为实际视图的帧的代码 在初始状态和最终状态之上,存在于PDFKitten中。您可以 请参阅该代码。
  • 将当前媒体框转换应用于帧。
  • 最后不要忘记 将结果帧转换为用户的坐标系。除此以外 你会观察相反的效果。