我有很多文本文件。每个文本文件都包含以下数据:
<text> Big data... big data... </text>
<text> another big data </text>
<text> some other data </text>
现在我必须编写一个带有lucene的代码,可以在搜索查询匹配时检索整行,
就像我搜索some data
一样,应该过滤整个第三行。
<text> some other data </text>
我已经能够使用spanQuery做一点,但这只返回文档和单词位置。如何从文本文件中获取“真实文本”?
请提供参考资料。
答案 0 :(得分:1)
我不确定你的意思。如果您只需检索一行,那么您可能希望每行创建一个Document
而不是每个文件。
然后IndexReader.document
将只检索相关的行。 (当然,从行到文件的映射会更复杂。)