如何在ruby / rails 3中复制/读取pdf文件

时间:2011-11-26 05:19:58

标签: ruby ruby-on-rails-3 pdf pdf-reader

我需要同时读入和写入pdf文件,并且在某些情况下合并我所拥有的PDF文件和我需要阅读的文件。我试图用pdf-reader gem和prawn gem来做这件事。

pdf-reader gem似乎不允许直接复制文件,而只是将文本从文件中拉出而没有格式化或图像,除非你单独编写它们。即便如此,它只会删除文件并跳过其他文件。红宝石还有什么东西吗?

编辑:更具体地说,在某些情况下,我需要pdf的精确副本,而在其他情况下,我需要将副本的副本覆盖在另一个副本的顶部。 pdf-reader或docsplit似乎都无法复制(阅读文本/格式/图像/字体等)。

4 个答案:

答案 0 :(得分:0)

答案 1 :(得分:0)

试试这个:Prawn:Ruby的快速,灵活的PDF生成 https://github.com/sandal/prawn

答案 2 :(得分:0)

在玩了很多游戏之后我发现了这个问题:overlay one pdf or ps file on top of another

似乎pdftk和它将要获得的一样好。

Rails有一个宝石,但看起来它不支持叠加:http://pdf-toolkit.rubyforge.org/

编辑:看起来像一个更好的宝石在那里但未发表支持叠加:https://github.com/tcocca/active_pdftk

答案 3 :(得分:0)

您可以使用Lucene或Solr(Ruby on Rails的钩子)来索引和读取.pdf文件以及Microsoft文档(即Word,PowerPoint,Excel)。