使用solr和集成nutch和solr时出错(HTTP ERROR 500)

时间:2012-07-24 14:40:16

标签: solr integration web-crawler nutch

我安装了Linux Ubuntu 12.04,我正在尝试安装nutch 1.5.1和solr 3.6.1并将主题集成在一起以抓取种子网址。
我正在使用This教程来完成这项工作 我按照3.2之前的步骤跳过step 4我可以访问
localhost:8983 / solr / admin /

没有错误。
但是当进入第6步并将schema.xml从nutch的conf文件夹复制到solr的example / solr / conf文件夹时 solr / admin页面出现java错误,如下:

first part of page second part

我该如何处理?

还有一件事要问...... 我有另一个tutorial,看起来不错,但在第一步中它提到在/ conf /和/ runtime / local / conf /文件夹中添加一些代码到nutch-site.xml文件

但在nutch文件夹中没有运行时文件夹。在步骤4中,此文件夹也提到了。 有什么建议吗?

提前致谢

2 个答案:

答案 0 :(得分:1)

这只是红鲱鱼。指定版本号的行如下:

<schema name="nutch" version="1.5.1">

导致它,因为版本的值被解析为float。删除额外的点。将其更改为1.5或1.51以使其有效浮动并重新启动您的solr实例。例外应该消失。

答案 1 :(得分:0)

请检查Nutch 1.5.1和Solr 3.6.1是否兼容(它们是否具有相同版本的lucene-core和solr-solrj jar)。我遇到了一些不兼容版本的问题,但不是1.5 / 3.6。