PySolr rss dataimport

时间:2010-01-26 14:35:45

标签: rss solr dataimporthandler pysolr

我正在使用PySolr来运行我的搜索。我想索引一个rss feed并想知道这是否可以使用PySolr,如果是这样你怎么做。

我在http://wiki.apache.org/solr/DataImportHandler#HttpDataSource_Example

找到了有关如何在Solr中执行此操作的说明

但找不到任何关于如何在PySolr

中执行等效操作的内容

由于

1 个答案:

答案 0 :(得分:2)

您可能不需要在PySolr中执行等效操作。如果您已经按照示例的方式将Solr编入索引,那么您只需使用PySolr来查询该索引。类似的东西:

from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
    do_stuff_with(result)

如果你真的想从Python那边做,那么你需要在那里获取和解析RSS(使用其他库,例如Universal Feed Parser); PySolr只包含与Solr的交互,它不“做”数据源。

您可能想要查看Haystack,它使用PySolr(并且可以使用其他引擎)并巧妙地抽象创建搜索索引条目并将其发送给Solr进行索引的工作。