是否可以导入PDF文件的栅格?

时间:2016-03-24 22:20:33

标签: r pdf r-raster

我们的办公室会扫描数据输入表格,而且我们缺少能够进行自动复式输入的专有软件(当然,主要输入是手工完成的)。我们希望为研究人员提供一种工具,以突出表格上的区域,并使用扫描版本来确定参与者的参赛作品。

要做到这一点,我需要进行非常粗略的尝试是将PDF文件作为光栅文件读取的文件,坐标为X,Y分量,B& W白色“强度”为Z轴。

我们主要使用R进行统计分析和数据管理,因此R中的选项会很棒。

1 个答案:

答案 0 :(得分:5)

您可以使用R中的光栅包。但是,它不支持.pdf文件,但是.tif,.jpg,.png(以及其他许多文件)。 但是将你的pdf转换为png不应该是一个大问题:查看here以获取更多信息。

准备好png文件后,您可以执行以下操作:

png <- raster("your/png/file.png")

然后使用extract()函数从图片中获取您的brigthness值。即让我们说你的png是200x200px,你想从第100行和第150列中提取一个像素值:

value <- extract(png, c(150,100))