Question

根据标题，我有什么方法可以将未受保护的PDF文件中的页面解析为javascript Image（）对象？

在运行javascript之前转换它们也没关系，但我希望这可以自动完成，无需任何需要安装的库的帮助。

互联网上有人发布了这个Bash脚本。不幸的是，我不知道Bash，但运行它非常简单。

#!/bin/bash
PDF='doc.pdf'
NUMPAGES=`identify -format %n "$PDF"`

for (( IDX=0; IDX<$NUMPAGES; IDX++ ))
do
  PAGE=$(($IDX+1))
  convert -resize 1200x900 "$PDF[$IDX]" `echo "$PDF" | sed "s/\.pdf$/-page$PAGE.jpg/"`
done

echo "Done"

但我收到了这些错误：

line 3: identify: command not found
line 5: ((: IDX<: syntax error: operand expected (error token is "<")

使用Bash脚本预转换PDF将是一个很好的解决方案。有人可以修复上面的脚本或提供替代解决方案吗？

非常感谢提前！

Answer 1

PDF.js可让您将PDF渲染到画布。然后你可以做类似的事情：

var img = new Image();
img.src = pdfCanvas.toDataURL();

我对PDF.js印象非常深刻。我喜欢让客户的浏览器为我做尽可能多的工作。

在这里演示：http://jsbin.com/pdfjs-helloworld-v2/1/edit

Answer 2

看起来第一个问题是缺少可执行文件：identify。这是ImageMagick的一部分：

http://www.imagemagick.org/script/index.php

确保你的路径也是如此。

将PDF页面解析为javascript图像

2 个答案: