标签: html node.js pdf puppeteer headless-browser
我知道可以用另一种方式(HTML到PDF),但是可以用另一种方式吗?
我没有找到任何与此相关的文档。
答案 0 :(得分:2)
否,Puppeteer不能用于将PDF转换为HTML。根据其网站:
Puppeteer是一个Node库,它提供了高级API来通过DevTools协议控制Chrome或Chromium。
也就是说,木偶戏是无头的Chrome。由于Chrome无法将PDF转换为HTML(如果我记错了,请纠正我),Puppeteer也不能。
但是,您可以使用其他npm模块,例如pdf-parse来解析PDF的文本内容,并自行生成HTML。或者,只需使用pdf2html之类的npm模块直接转换pdf。