搜索引擎能够搜索多个视图的完全匹配?

时间:2014-11-12 21:23:38

标签: database search hash lucene search-engine

假设我有一堆原始文本,我想在其上执行搜索。

Example:  "* escaped", or "president of the United States". 

我通过索引许多可能的n-gram来搜索许多可以做到这一点的工具(例如Lucene)。

假设除了原始文本(视图1)之外,我还通过将每个单词分配给lebel = {A,B}来创建另一个视图,这是另一个原始文本视图(视图2)。例如,如果有一个包含以下内容的文档:

View1 = "Jack killed John because he doesn't know how to code"

我们有视图2,完全针对每个单词:

View2 = "A    B      A      B     A   A      B    A   A   B"

(一般情况下,我可能会有更多观点,但我们可以说有两种观点)

鉴于第二种观点,我希望能够搜索两个视图的组合。

例如:

"A of the United States" 

"president of the B" 

或者可能明确指定:

"V2={A} V1={of the United States" 

"V1={president of the} V2={B}" 

现有搜索引擎中是否有类似功能?

1 个答案:

答案 0 :(得分:0)

BlackLab做我想要的,虽然不确定它是如何工作的: https://github.com/INL/BlackLab