标签: pdfbox
是否有一种方法可以遍历PDF文件中的文本对象(例如文本标签或文本框)并获取这些对象的属性(例如页面上的x,y位置和文本本身)?
我需要获取一些特定的文本片段,它们靠近页面的特定位置(即在页面中的位置),即在页面中的位置。可悲的是,当我仅提取文本时,通常不会获得可用来获取所需值的字符串。