我正在尝试使用命令pdftotext来处理来自stdin的数据,而不必将中间数据缓存到临时文件中。请注意,正在从Java程序执行pdftotext命令。
pdftotext需要一个文件参数,如果没有给出,则打印使用信息。据我所知,stdin被忽略了。
我有一个不可移植的解决方案(在Linux上使用伪文件'/ dev / stdin')。假设pdftotext程序存在,理想的解决方案适用于linux和windows。
答案 0 :(得分:3)
pdftotext似乎支持使用-
作为说'stdin'的特殊方式的惯例。好跑
pdftotext - mypdf.txt
将尝试从stdin读取pdf文档并将其输出到mypdf.txt文件。您也可以使用-
作为输出文件,在这种情况下,它会将转换后的pdf输出到stdout而不是常规文件。