根据标题,我有什么方法可以将未受保护的PDF文件中的页面解析为javascript Image()对象?
在运行javascript之前转换它们也没关系,但我希望这可以自动完成,无需任何需要安装的库的帮助。
互联网上有人发布了这个Bash脚本。不幸的是,我不知道Bash,但运行它非常简单。
#!/bin/bash
PDF='doc.pdf'
NUMPAGES=`identify -format %n "$PDF"`
for (( IDX=0; IDX<$NUMPAGES; IDX++ ))
do
PAGE=$(($IDX+1))
convert -resize 1200x900 "$PDF[$IDX]" `echo "$PDF" | sed "s/\.pdf$/-page$PAGE.jpg/"`
done
echo "Done"
但我收到了这些错误:
line 3: identify: command not found
line 5: ((: IDX<: syntax error: operand expected (error token is "<")
使用Bash脚本预转换PDF将是一个很好的解决方案。有人可以修复上面的脚本或提供替代解决方案吗?
非常感谢提前!
答案 0 :(得分:21)
PDF.js可让您将PDF渲染到画布。然后你可以做类似的事情:
var img = new Image();
img.src = pdfCanvas.toDataURL();
我对PDF.js印象非常深刻。我喜欢让客户的浏览器为我做尽可能多的工作。
答案 1 :(得分:1)
看起来第一个问题是缺少可执行文件:identify
。这是ImageMagick的一部分:
http://www.imagemagick.org/script/index.php
确保你的路径也是如此。