我有一个rails应用程序,允许用户上传pdf文件,然后在后台使用pdftohtml将其转换为html,然后解析html并进行更多处理。
我的所有其他功能都在heroku上运行,除此之外。
如何在heroku上安装pdftohtml?
我想把pdftohtml包装在我的自定义宝石中。这是可行的。
还有其他方法吗?
提前致谢
答案 0 :(得分:4)
我不知道“pdftohtml”应该是什么,但我会推荐某种基于wkhtmltopdf的gem,它允许你使用静态二进制文件,你可以在heroku上运行而不会出现问题。这个主题实际上有很好的记录,您可以尝试这样的事情:http://www.mobalean.com/blog/2011/08/02/pdf-generation-and-heroku
答案 1 :(得分:0)
有许多宝石可用于处理此任务。 您可以使用pdf-reader进行转换。
我想你需要像pdftohtmlr这样的命令行工具pdftohtml的包装器。但我认为你不能在heroku上使用它。