我想实现一个需要解析word文档的功能,这些文档将由用户上传并存储在amazon S3上。该应用程序将在heroku上。我试过catdoc,但它没有解析网址。任何人都可以建议可以在heroku上使用的工具来解析word文档吗?
UPDATE 我想扫描一个上传的ms-word(.doc)有特定的单词并相应地标记它们。
答案 0 :(得分:1)
如果您只想上传word文档,可以查看paperclip gem之类的内容。
这将允许您将文件保存在amazon S3上并简单地下载它,但您也可以扩展回形针并对文件运行后处理。这稍微复杂一些。
就像willglynn所说的那样,知道你需要做什么解析会很好吗?