我们的办公室会扫描数据输入表格,而且我们缺少能够进行自动复式输入的专有软件(当然,主要输入是手工完成的)。我们希望为研究人员提供一种工具,以突出表格上的区域,并使用扫描版本来确定参与者的参赛作品。
要做到这一点,我需要进行非常粗略的尝试是将PDF文件作为光栅文件读取的文件,坐标为X,Y分量,B& W白色“强度”为Z轴。
我们主要使用R进行统计分析和数据管理,因此R中的选项会很棒。
答案 0 :(得分:5)
您可以使用R中的光栅包。但是,它不支持.pdf文件,但是.tif,.jpg,.png(以及其他许多文件)。 但是将你的pdf转换为png不应该是一个大问题:查看here以获取更多信息。
准备好png文件后,您可以执行以下操作:
png <- raster("your/png/file.png")
然后使用extract()
函数从图片中获取您的brigthness值。即让我们说你的png是200x200px,你想从第100行和第150列中提取一个像素值:
value <- extract(png, c(150,100))