标签: hadoop pdf mapreduce recordreader
我需要将PDFPreserveLayout转换为Mapreduce中的文本文件,我使用PDFBOX将普通的pdf文件转换为文本文件,但它不适用于pdfpreservelayout。 任何人都可以帮助解决这个问题吗?