我正在做一些数据挖掘编码,我想根据现有的数据集,根据规则条件是否正确分类,将规则引导表格分类。
假设我有以下数据集:
[ Temperature Headache Nausea Flu ]
high ? no yes
very-high yes yes yes
我的算法引发了规则
(Headache, yes) -> (Flu, yes)
为了检查我的规则集是否正确,我想通过查看每个数据集来检查分类,并检查头痛是否为肯定,流感是否为肯定。
我能够轻松地做到这一点,但如果我的规则中有不同的条件,例如:
,该怎么办?(Temperature, high) & (Nausea, no) -> (Flu, yes)
如何同时检查这两个条件?
我将条件保存在HashSet
中,数据集为ArrayList
个HashSet
,其中每行为HashSet
。
答案 0 :(得分:0)
使用containsAll
这应该完全相同。
这不是最快或最聪明的方法,微小数据的错误认为在这里使用ArrayList<HashSet<String>>
是可以的。更好的方法是使用倒排索引。