我正在使用PySolr来运行我的搜索。我想索引一个rss feed并想知道这是否可以使用PySolr,如果是这样你怎么做。
我在http://wiki.apache.org/solr/DataImportHandler#HttpDataSource_Example
找到了有关如何在Solr中执行此操作的说明但找不到任何关于如何在PySolr
中执行等效操作的内容由于
答案 0 :(得分:2)
您可能不需要在PySolr中执行等效操作。如果您已经按照示例的方式将Solr编入索引,那么您只需使用PySolr来查询该索引。类似的东西:
from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
do_stuff_with(result)
如果你真的想从Python那边做,那么你需要在那里获取和解析RSS(使用其他库,例如Universal Feed Parser); PySolr只包含与Solr的交互,它不“做”数据源。
您可能想要查看Haystack,它使用PySolr(并且可以使用其他引擎)并巧妙地抽象创建搜索索引条目并将其发送给Solr进行索引的工作。