如何从pdf文件中获取突出显示的单词?

时间:2010-07-05 09:03:11

标签: java pdf

我开发了新程序,但我需要允许用户在pdf文件中突出显示单词然后我想处理文件以获取带位置的突出显示单词列表

如何通过java

来做到这一点

提前谢谢

2 个答案:

答案 0 :(得分:0)

PDF文件是PostScript,很难处理。我怀疑这是一个简单的方法。

看看http://java-source.net/open-source/pdf-libraries,但请注意,您可能会遇到一些困难。

另外,请阅读http://partners.adobe.com/public/developer/en/pdf/HighlightFileFormat.pdf了解高亮格式的规格。根据您需要的“地点”信息,这可能就足够了。

答案 1 :(得分:0)

您是如何显示PDF的?如果要显示图像,则只需要坐标一词。像PdfBox或JPedal或者IText这样的东西可以做到这一点。