我想要裁剪数百张PDF。对于每个PDF,我都有一组独特的坐标可供裁剪。我正在尝试使用R的magick包(版本ImageMagick 6.9.9.14),但在导入PDF时收到错误。
magick文档中的这个示例引发了一个错误:
library(magick)
manual <- image_read('https://cran.r-project.org/web/packages/magick/magick.pdf', density = "72x72")
我收到的错误是“magick_image_readpath中的错误(路径,密度,深度,条带):Magick:PDFDelegateFailed”系统找不到指定的文件。 '@ error / pdf.c / ReadPDFImage / 809“
当我检查配置设置时:
magick_config
我发现ghostscript是真的。我不确定是否需要其他设置来阅读PDF。
有没有其他人遇到类似magick的问题?我愿意接受能够裁剪PDF的替代软件包,如果有的话。
答案 0 :(得分:2)
我在Windows上遇到了同样的问题。这不是R问题。就我而言,我使用64位ImageMagick但安装了GhostScript 32位。安装64位版本的GhostScript后,它没有任何问题。
答案 1 :(得分:0)
您可以使用tabulizer
包。
library(tabulizer)
manual_url <- "https://cran.r-project.org/web/packages/magick/magick.pdf"
manual <- extract_text(manual_url)
要安装tabulizer
,请完全按照these steps。