有没有人知道获取pdf文档的最佳方法,并替换匹配模式的所有子字符串([AZ] [AZ] [AZ]''[0-9] [0-9] [0- 9] [0-9] | [AZ]),并用相同字符串的超链接替换为同一个字符串。
我计划允许用户查看pdf文档(这是一个可以获得学位的类列表),并允许用户单击一个类,以便将其添加到列表中。
据我所知,我可以在JEditorPane中添加一个超链接,我假设它可以在PDF格式的超链接上工作(我希望)
我正在研究pdfbox和iText,但到目前为止,我仍然坚持如何替换文本。
*我计划从URL中提取pdf,并动态格式化超链接(无需导出到文件)。
期待反馈。
答案 0 :(得分:2)
我找到了这个例子 http://pdfbox.apache.org/apidocs/org/apache/pdfbox/examples/pdmodel/ReplaceString.html
通过在代码中加入Pattern匹配器,我能够更新文本并根据我要替换的字符串替换与模式匹配的字符串。