java lucene索引的示例代码和搜索每行创建一个文档

时间:2013-03-04 13:07:47

标签: lucene

我是lucene的新手。我有一个包含100条记录的文本文件,每行有两列。第一列是userid,第二列是url_list(我想那些将是我的文档字段)

我需要使用lucene提供搜索功能,该功能将为包含输入的url或userid的文档提供。为此,我需要在文本文件的每一行创建一个lucene文档。

请为我提供一些示例代码 ..

我正在使用lucene版本3.6.2

1 个答案:

答案 0 :(得分:2)

这是一个简短而精彩的Lucene初学者教程。

Lucene in 5 minutes


步骤

1)我假设您正在预解析文本文件以获取userid,相应的url列表。你必须这样做。 Lucene不会帮忙。 Lucene确实打破了属于单个字段的文本,但不会破坏文本并将userid添加到userid字段并将URL添加到URL字段。

2)阅读上面的教程。我强烈建议您使用Lucene的latest version,现在是4.1。

3)要记住的事项特定于您的用例

  • 每个文档都有两个字段:USER_ID,URL(当然您可以更改这些名称)

  • 不要分析(分成令牌)USER_ID字段的内容。

  • 我不确定您希望如何存储网址字段。您可能不想分析它或使用识别URL的StandardAnalyzer而不进行标记。

4)您可以在教程中找到索引,查询,搜索和检索结果的示例代码。