集成拥有Nutch抓取数据和Solr的Hbase

时间:2013-03-10 14:50:51

标签: solr amazon-web-services hbase nutch

我有一个Hbase数据库,其中包含wikipedia.org的抓取信息。我的机器在Amazon Wweb Services。

我已经下载了Solr,我想在Hbase上对数据进行索引,之后我将对其进行搜索。

我是Solr和Hbase的新手,我该怎么做?

1 个答案:

答案 0 :(得分:0)

您只需运行此命令 - sudo bin/nutch solrindex http://localhost:8983/solr/ -reindex

即可

但在您这样做之前,请确保您的solr实例已启动并运行,您可以通过访问此链接http://localhost:8983/solr/来验证,如果您可以找到Solr admin,那么您的Solr实例正在运行。