如何使用nodejs读取docx文件?

时间:2019-04-26 10:03:55

标签: node.js view electron docx

作为上面的标题。现在,我正在制作一个电子应用程序,其功能是显示包含单词和图像的docx文件的内容。 有谁知道一个nodejs库可以做到这一点?

2 个答案:

答案 0 :(得分:0)

我有过几次这个问题(很想听听您最终使用的内容)。

我们已经使用了Textract(https://www.npmjs.com/package/textract)(注意。有一个Python包和一个具有相同名称的AWS服务;它们都不相关。)这只是为了输出纯文本。它一直在使用某些格式,特别是PDF。如果您还想要图像和格式,那不是您想要的。

一个快速的Google找到了以下列表: https://libraries.io/search?keywords=docx&languages=JavaScript

猛Ma(https://github.com/mwilliamson/mammoth.js)被积极开发。注意它描述的限制。但是,它产生HTML的事实将使您在Electron应用程序中的显示更加容易。

自从我上次搜索以来,

LibreOffice转换(https://github.com/elwerene/libreoffice-convert)对我来说是新的。利用LibreOffice听起来很明智。它只是围绕LibreOffice无头模式的简单包装。依赖性使它不适合电子应用程序。

沿着同一行,您可以尝试使用pandoc(https://github.com/eshinn/node-pandoc)包装器

答案 1 :(得分:0)

2021 年 7 月

如果您只想使用 DOCX 或纯文本,您可以使用 texttract-lite

texttract

中提供更多文档类型(10+)
yarn add @nosferatu500/textract

https://github.com/nosferatu500/textract

yarn add @nosferatu500/textract-lite

https://github.com/nosferatu500/textract-lite