在Ubuntu 10.04上安装PyLucene 3.0.3

时间:2011-04-06 01:49:53

标签: java python lucene makefile pylucene

我正在尝试在Ubuntu 10.04上安装PyLucene 3.0.3。事实证明这具有相当大的挑战性,但到目前为止我已经:

  • 按照PyLucene文档中的说明修补setuptools以允许构建JCC。
  • 建立JCC:cd pylucene-3.0.3-1 / jcc; python setup.py build
  • 通过ant构建Lucene 3.0.3,并将jar安装到/usr/share/java/lucene-core-3.0.3-dev.jar。注意,我将Ubuntu的默认Lucene软件包安装到/usr/share/java/lucene-core-2.9.2.jar,它也符号链接到/usr/share/java/lucene-core.jar

我现在正试图“制作”PyLucene,但我收到错误:

cd lucene-java-3.0.3;  -Dversion=3.0.3
/bin/sh: -Dversion=3.0.3: not found
make: *** [lucene-java-3.0.3/build/lucene-core-3.0.3.jar] Error 127

文件pylucene-3.0.3-1 / doc / documentation / install.html提到“编辑Makefile以匹配您的环境”,但我不确定这意味着什么。 makefile似乎包含与我安装的版本号相同的Lucene版本号。我还需要编辑我的makefile才能构建PyLucene吗?

编辑:取消注释makefile中的一个部分(感谢Torsten)在Ubuntu 8.10下编译(严重的是,8.10 ?!),大部分编译好了,但我仍然收到错误。几个组件报告“BUILD SUCCESSFUL”,但最终版本以:

结束
/usr/bin/python -m jcc --shared --jar lucene-java-3.0.3/build/lucene-core-3.0.3.jar --jar lucene-java-3.0.3/build/contrib/snowball/lucene-snowball-3.0.3.jar --jar lucene-java-3.0.3/build/contrib/analyzers/common/lucene-analyzers-3.0.3.jar --jar lucene-java-3.0.3/build/contrib/regex/lucene-regex-3.0.3.jar --jar lucene-java-3.0.3/build/contrib/memory/lucene-memory-3.0.3.jar --jar lucene-java-3.0.3/build/contrib/highlighter/lucene-highlighter-3.0.3.jar --jar lucene-java-3.0.3/build/contrib/queries/lucene-queries-3.0.3.jar --jar build/jar/extensions.jar  --package java.lang java.lang.System java.lang.Runtime --package java.util java.util.Arrays java.text.SimpleDateFormat java.text.DecimalFormat java.text.Collator --package java.io java.io.StringReader java.io.InputStreamReader java.io.FileInputStream --exclude org.apache.lucene.queryParser.Token --exclude org.apache.lucene.queryParser.TokenMgrError --exclude org.apache.lucene.queryParser.QueryParserTokenManager --exclude org.apache.lucene.queryParser.ParseException --exclude org.apache.lucene.search.regex.JakartaRegexpCapabilities --exclude org.apache.regexp.RegexpTunnel --python lucene --mapping org.apache.lucene.document.Document 'get:(Ljava/lang/String;)Ljava/lang/String;' --mapping java.util.Properties 'getProperty:(Ljava/lang/String;)Ljava/lang/String;' --rename org.apache.lucene.search.highlight.SpanScorer=HighlighterSpanScorer --version 3.0.3 --module python/collections.py --files 200 --build 
/usr/bin/python: jcc is a package and cannot be directly executed
make: *** [compile] Error 1

1 个答案:

答案 0 :(得分:2)

之前我做过(但没有在Ubuntu中安装Lucene的默认包)。我不知道到底是什么Error 127,但在我的情况下,它有助于在我的Makefile中设置NUM_FILES=200原始NUM_FILES=2。出于某种原因,当NUM_FILES=2它在内存中创建了非常大的文件时,ubuntu将无法处理。使用NUM_FILES=200时,块很小,最后安装对我有用。对于python 2.6,您还必须更改Makefile中的JCC设置(见下文)。

这里是Makefile中对我来说很重要的部分:

# Linux     (Ubuntu 8.10 64-bit, Python 2.5.2, OpenJDK 1.6, setuptools 0.6c9)
PREFIX_PYTHON=/usr
ANT=ant
PYTHON=$(PREFIX_PYTHON)/bin/python
JCC=$(PYTHON) -m jcc.__main__ --shared
NUM_FILES=200