RAILS3:全文搜索Word文档?

时间:2011-07-14 15:49:31

标签: ruby-on-rails-3 ms-word full-text-search documents

我的公司拥有大约3500个高度结构化的Word文档(以及不断增长的),其中包含来自我们某个产品的多项选择题。我的任务是编写一个前端,让人们在其他产品中找到并使用它们。它们上面有一些元数据会存在于数据库中,但我们也喜欢全文搜索。

我已经选择使用前端MS Access(因为我很清楚)或Rails(因为我应该学习它)。我已经完成了一个Rails应用程序,并希望继续使用它。

不是将文档加载到数据库中,而是认为将它们放在文件系统上并在数据库中存储它们的路径更有意义。

我知道我可以使用Ferret来搜索数据库字段,但是为文件系统上的一堆文件添加全文搜索到Rails应用程序的最佳方法是什么?

1 个答案:

答案 0 :(得分:0)

不确定是否有任何宝石会为您搜索单词文件。虽然您已经提到过您不想将整个文档加载到数据库中,但您可能只需要复制数据库中每个文件的文本内容。您可以使用win32ol库来执行此操作(http://ruby-doc.org/stdlib/libdoc/win32ole/rdoc/classes/WIN32OLE.html)。如果我必须执行此操作,我会每晚运行一个cron作业(或任何频率似乎合适)将使用word文件中的更改刷新数据库内容。