我有一个项目,我必须从PDF文件内部(而不是从metaData)获取标题,作者信息。所以我尝试通过给定坐标从PDF中读取文本并尝试获取文本字体。
有没有办法做到这一点,有人可以提供建议吗?或者是否有其他解决方案来完成我的项目?
感谢您的帮助,并认为您与我分享。
答案 0 :(得分:0)
有多个Java的PDF库允许您提取文本,我最喜欢的是iText,作为文本解析的示例,请查看第15章中的ExtractPageContentArea和其他examples iText in Action,第2版。
目前没有使用字体信息的示例,但RenderListeners可以使用这些信息。