解析word docs heroku / s3

时间:2012-11-03 19:30:06

标签: ruby-on-rails heroku ms-word

我想实现一个需要解析word文档的功能,这些文档将由用户上传并存储在amazon S3上。该应用程序将在heroku上。我试过catdoc,但它没有解析网址。任何人都可以建议可以在heroku上使用的工具来解析word文档吗?

UPDATE 我想扫描一个上传的ms-word(.doc)有特定的单词并相应地标记它们。

1 个答案:

答案 0 :(得分:1)

如果您只想上传word文档,可以查看paperclip gem之类的内容。

这将允许您将文件保存在amazon S3上并简单地下载它,但您也可以扩展回形针并对文件运行后处理。这稍微复杂一些。

就像willglynn所说的那样,知道你需要做什么解析会很好吗?