如何使用NodeJS将PDF转换为DOCX或URL转换为DOCX?

时间:2018-02-07 04:49:50

标签: javascript node.js docx

我尝试在NodeJS中研究URL to DOCxPDF to DOCx对话,但没有得到任何正确的解决方案。

我联系了PhantomJS,但它转换URL to PDF是否有任何想法,幻影可以转换为DOCX?

请就docx对话提出建议。

注意: 不需要向Docx提供HTML内容因为我在HTML网页上提供了MAP和其他图表,因此需要使用网址。

1 个答案:

答案 0 :(得分:2)

很少有免费的开源实用程序可以将HTML转换为DOCX,甚至可以做得更少,因此具体询问Node.js是非常具体的。如果您可以轻松地发布简单命令,则可以使用pandoc将URL转换为DOCX。我建议首先在没有Node的情况下在本地测试此实用程序。

pandoc -f html https://stackoverflow.com/questions/48656219 -o 48656219.docx

免责声明: Pandoc是一个标记转换器,而不是一个完整的HTML渲染器。这意味着您将没有完整的浏览器...例如您将失去格式,并且通常会出现许多常见HTML和CSS技术的渲染问题。以下是使用pandochttps://i.stack.imgur.com/LfUhw.png

呈现此页面的信息

如果它有效,那么你很幸运,因为有一个可用的pandoc npm包。 https://www.npmjs.com/package/node-pandoc

var pandoc = require('node-pandoc');
var src, args, callback;

src = 'https://stackoverflow.com/questions/48656219';
args = ['-f','html', '-o','48656219.docx'];

// Set your callback function 
callback = function (err, result) {

  if (err) {
    console.error('Oh Nos: ',err);
  }

  // For output to files, the 'result' will be a boolean 'true'. 
  // Otherwise, the converted value will be returned. 
  console.log(result);
  return result;
};

// Call pandoc 
pandoc(src, args, callback);