使用多个布尔查询对是或否意见进行分类

时间:2018-08-10 08:15:46

标签: java lucene information-retrieval booleanquery

我收集了一些表达关于公投的是或否意见的推文。我也有两组支持“是”和“否”的政客。类似地,我有两组表达“是”和“否”的词。这些单词是使用图分析提取的。

现在,我必须决定某个特定的推文属于“是”还是“否”。如何提出查询?

我认为以下情况会返回“是”文件:

(Yes_Politician1 OR Yes_Politician2 OR Yes_Politician3 OR...) AND (Yes_Word1 OR Yes_Word2 OR Yes_Word3....) 

您认为上述查询有效吗?我还应该告诉您,某些单词可能同时属于Yes和No单词集。

1 个答案:

答案 0 :(得分:0)

“我还应该告诉您某些单词可能同时属于Yes和No单词集。”

那么,不,如果对于“ Yes_Politician3”来说,如果他的“ No_Word3”与其他“ Yes_Word1”重叠,则上述方法将无效。然后,您的if陈述式不会将他的陈述归类为错误的组吗?还是您说的是“属于两组”的另一种说法?