我将文档转换为内存中的pdf(unoconv)并在终端中打印(pdftotext):
unoconv -f pdf --stdout sample.doc | pdftotext -layout -enc UTF-8 - out.txt
正在工作。现在我想使用此命令与child_process.spawn
:
let filePath = "...",
process = child_process.spawn("unoconv", [
"-f",
"pdf",
"--stdout",
filePath,
"|",
"pdftotext",
"-layout",
"-enc",
"UTF-8",
"-",
"-"
]);
在这种情况下,只有第一个命令(在|之前)有效。我可以做我想做的事吗?
感谢。
UPDATE -
结果:sh -c- ....
bash-3.2$ sh -c- unoconv -f pdf --stdout /Users/fatimaalves/DEV/xx/_input/sample.doc | pdftotext -layout -enc UTF-8 - -
sh: --: invalid option
Usage: sh [GNU long option] [option] ...
sh [GNU long option] [option] script-file ...
GNU long options:
--debug
--debugger
--dump-po-strings
--dump-strings
--help
--init-file
--login
--noediting
--noprofile
--norc
--posix
--protected
--rcfile
--restricted
--verbose
--version
--wordexp
Shell options:
-irsD or -c command or -O shopt_option (invocation only)
-abefhkmnptuvxBCHP or -o option
Syntax Warning: May not be a PDF file (continuing anyway)
Syntax Error: Couldn't find trailer dictionary
Syntax Error: Couldn't find trailer dictionary
Syntax Error: Couldn't read xref table
答案 0 :(得分:5)
以管道开头的所有内容都不是unoconv
的参数。它由shell处理,而不是由unoconv
处理。因此,您无法将其作为unoconv
中的参数数组的一部分传递。
根据您的需要,有很多方法可以解决这个问题。如果您知道将仅在类UNIX操作系统上运行,则可以将命令作为参数传递给sh
:
process = child_process.spawn('sh', ['-c', 'unoconv -f pdf --stdout sample.doc | pdftotext -layout -enc UTF-8 - out.txt']);
答案 1 :(得分:2)
如果您不想使用如上所述的sh
命令,则必须创建多个child_process.spawn实例,然后像这样通过管道将它们相互连接:
const getModule = spawn('curl', [url, '-ks']);
const unTar = spawn('tar', ['-xvz', '-C', fileName, '--strip-components', 1]);
getModule.stdout.pipe(unTar.stdin);
以上代码从理论上讲将从url
检索tar,然后解压缩到目录fileName