我想做这些任务: 1 - 在pdf中找到一个单词 2 - 突出显示该pdf中的所有事件, 3 - 将高亮显示的pdf保存为其页面图像。
我该怎么做? 任何帮助将不胜感激。
答案 0 :(得分:1)
com.itextpdf.text.pdf.parser.LocationTextExtractionStrategy
它将为您提供页面上每个文本的基线,上升和下降。您可以根据这些信息构建单词和矩形。
不容易,但可能。
之后,您只需要调用GhostScript或PDFBox或可以呈现PDF的内容。几乎没有“容易的部分”,但它已经解决了很多次问题。