标签: java c# pdfbox pdfminer
我目前正在开展一个项目,我使用pdfbox将格式完整的pdf中的内容提取到文本文件,但是对于少数pdf,格式化将丢失。这是因为这个pdf模板中的非结构化表格结构。