我有以下问题,我需要为标记的文章构建lucene索引。
这是简化的数据结构和lucene提案:
article_id -> unindexed
article_title -> UnStored
article_content -> UnStored
article_tags -> ????? (here is the problem)
所以文章可以有多个标签。假设我们有一篇文章A,它有以下标签:T1,T2,T3。问题是T1,T2,T3由ID(数字)表示,我不能将其作为文本表示存储在索引中,因为它可以更改(然后我需要重建索引搜索所有带有已更改标记的文章删除并将它们添加到索引一次)。然后我需要在带有T1和T2标签的文章中搜索。分配给文章的标签数量不受限制(关系1-n)。是否有可能搜索带有某些标签(标签ID)的文章?
希望我很清楚。有没有人有这个问题的有效解决方案?提前致谢。
答案 0 :(得分:0)
你可以用Lucene做到这一点。一种方法是为每个标签 - 文章对创建文档,并使用AND搜索标签。
你应该使用Lucene吗?我不确定。在您的描述中,您不使用任何全文搜索功能。为什么不使用数据库? 我建议你阅读Search Engine versus DBMS并根据那里定义的标准进行选择。