文件搜索引擎 - 从哪里开始?

时间:2014-02-27 14:20:01

标签: django drupal solr full-text-search search-engine

我必须为内部网构建一个简单的文件搜索引擎(带有搜索pdf,txt等字段的视图和显示最佳匹配的视图)。我正在寻找解决方案/建议:

我正在考虑Django + Solr(haystack)或Drupal。是否有针对此目标的开源平台?

修改

我选择了Django + Haystack解决方案。 http://django-haystack.readthedocs.org/en/latest/rich_content_extraction.html?highlight=pdf

1 个答案:

答案 0 :(得分:1)

除了在您选择的数据库中构建django模型之外,没有其他平台。安装django-haystack,solr服务器等...用haystack注册您的模型,构建您的UI(实际上只有两页/ 3个视图)

在django中应该是一个相对简单的过程。

一个三页的views.py文件,

索引,搜索(甚至不是页面,只是一个返回结果的视图,结果(模板显示搜索视图返回的数据库对象)。

如果您有使用Django的经验,使用Django可以在45分钟内完成。没有经验可能需要几个小时,如果你挂断电话,可能需要几天时间。