如何使用Ruby中的“PDF-Reader”gem获取文本的位置

时间:2015-10-01 16:56:01

标签: ruby ruby-on-rails-4 selenium pdf-reader

我是Ruby的新手,我们正在使用Ruby Selenium框架来自动化PDF验证测试。 我想验证PDF的内容,如文本,并获得文本的位置。除此之外,我还需要将文本放在给定的位置。

1 个答案:

答案 0 :(得分:0)

这样的事可能

require 'pdf-reader'
require 'open-uri'
reader = PDF::Reader.new(open("SAMPLE_URL")) # my resume pdf
page = reader.pages.first
lines = page.split("\n")
text_match_line_numbers = [0...lines.length].select do |i|
  lines[i] .include? "text"
end

查看他们的文档here,还有更多用于浏览PDF页面的高级选项。