将PDF页面解析为javascript图像

时间:2012-10-16 18:24:09

标签: javascript image bash pdf

根据标题,我有什么方法可以将未受保护的PDF文件中的页面解析为javascript Image()对象?

在运行javascript之前转换它们也没关系,但我希望这可以自动完成,无需任何需要安装的库的帮助。

互联网上有人发布了这个Bash脚本。不幸的是,我不知道Bash,但运行它非常简单。

#!/bin/bash
PDF='doc.pdf'
NUMPAGES=`identify -format %n "$PDF"`

for (( IDX=0; IDX<$NUMPAGES; IDX++ ))
do
  PAGE=$(($IDX+1))
  convert -resize 1200x900 "$PDF[$IDX]" `echo "$PDF" | sed "s/\.pdf$/-page$PAGE.jpg/"`
done

echo "Done"

但我收到了这些错误:

line 3: identify: command not found
line 5: ((: IDX<: syntax error: operand expected (error token is "<")

使用Bash脚本预转换PDF将是一个很好的解决方案。有人可以修复上面的脚本或提供替代解决方案吗?

非常感谢提前!

2 个答案:

答案 0 :(得分:21)

PDF.js可让您将PDF渲染到画布。然后你可以做类似的事情:

var img = new Image();
img.src = pdfCanvas.toDataURL();

我对PDF.js印象非常深刻。我喜欢让客户的浏览器为我做尽可能多的工作。

在这里演示:http://jsbin.com/pdfjs-helloworld-v2/1/edit

答案 1 :(得分:1)

看起来第一个问题是缺少可执行文件:identify。这是ImageMagick的一部分:

http://www.imagemagick.org/script/index.php

确保你的路径也是如此。