如何检查表是否包含规则集的条件

时间:2017-02-20 05:44:16

标签: java data-mining

我正在做一些数据挖掘编码,我想根据现有的数据集,根据规则条件是否正确分类,将规则引导表格分类。

假设我有以下数据集:

[ Temperature Headache Nausea Flu ]
  high        ?        no     yes 
  very-high   yes      yes    yes

我的算法引发了规则

(Headache, yes) -> (Flu, yes)

为了检查我的规则集是否正确,我想通过查看每个数据集来检查分类,并检查头痛是否为肯定,流感是否为肯定。

我能够轻松地做到这一点,但如果我的规则中有不同的条件,例如:

,该怎么办?
(Temperature, high) & (Nausea, no) -> (Flu, yes)

如何同时检查这两个条件?

我将条件保存在HashSet中,数据集为ArrayListHashSet,其中每行为HashSet

1 个答案:

答案 0 :(得分:0)

使用containsAll这应该完全相同。

这不是最快或最聪明的方法,微小数据的错误认为在这里使用ArrayList<HashSet<String>>是可以的。更好的方法是使用倒排索引。