我在两台机器上使用相同版本的xpdf。但是,在Windows 7 PC上创建的.txt文件与在Ubuntu 12.04 Linux服务器上创建的文件不同。 Windows 7 .txt文件很好地形成了许多换行符,使得解析相当容易。但是,linux版本根本不包含任何换行符。 Windows 7上的pdftotext是否使用了在linux上运行时需要显式调用的选项?
答案 0 :(得分:2)
通过阅读以下http://linux.die.net/man/1/pdftotext手册页,我看到以下内容:
-eol unix | dos | mac
您可以尝试使用以下标志执行,看看是否可以解决问题:
pdftotext -eol dos