在上传到S3存储桶之前,如何使用paperclip和pdf-reader解析PDF?

时间:2016-11-02 17:31:40

标签: ruby-on-rails pdf paperclip pdf-reader

我正在构建一个解析PDF格式CV的功能。我有一个被调用的方法:before_save,它处理解析。在使用...

保存之前,我可以在此方法中访问PDF文件

file = cv.queued_for_write[:original]

但是我需要将文件传递给PDF :: Reader,但是,似乎pdf-reader只接受文件的路径或URL,而不接受实际文件本身。这种方法......

reader = PDF::Reader.new(file)

引发此错误:

ArgumentError (input must be an IO-like object or a filename):

我是否需要将文件保存到tmp文件夹或其他内容然后将路径传递给pdf-reader进行解析?我希望尽快解析PDF,这似乎并不理想。任何建议表示赞赏!

1 个答案:

答案 0 :(得分:1)

我发现" queued_for_write" object有一个路径属性。

file = cv.queued_for_write[:original]

所以我可以像这样访问它:

reader = PDF::Reader.new(file.path)