我是lucene的新手。我有一个包含100条记录的文本文件,每行有两列。第一列是userid,第二列是url_list(我想那些将是我的文档字段)
我需要使用lucene提供搜索功能,该功能将为包含输入的url或userid的文档提供。为此,我需要在文本文件的每一行创建一个lucene文档。
请为我提供一些示例代码 ..
我正在使用lucene版本3.6.2
答案 0 :(得分:2)
这是一个简短而精彩的Lucene初学者教程。
步骤
1)我假设您正在预解析文本文件以获取userid,相应的url列表。你必须这样做。 Lucene不会帮忙。 Lucene确实打破了属于单个字段的文本,但不会破坏文本并将userid添加到userid字段并将URL添加到URL字段。
2)阅读上面的教程。我强烈建议您使用Lucene的latest version,现在是4.1。
3)要记住的事项特定于您的用例
每个文档都有两个字段:USER_ID,URL(当然您可以更改这些名称)
不要分析(分成令牌)USER_ID字段的内容。
我不确定您希望如何存储网址字段。您可能不想分析它或使用识别URL的StandardAnalyzer而不进行标记。
4)您可以在教程中找到索引,查询,搜索和检索结果的示例代码。