对于一个安全的数据访问系统,我有一个数据请求集合,每个请求都具有用户希望访问的1个或多个属性。
我正在尝试确定一组“标准提取”是否可行,因此我想将具有相似属性集的数据请求分组到少数存储桶中。
例如:
request_1: [
attr_a,
attr_b,
attr_c
],
request_2: [
attr_d,
attr_e,
attr_f
],
request_3: [
attr_b,
attr_c,
attr_e
],
request_4: [
attr_d,
attr_e,
attr_f,
attr_g
]
可能分组为[request_1, request_3]
和[request_2, request_4]
。群组的请求将具有重叠的属性,并且不要求群组具有互斥的属性集。
我想不出一种好的算法来识别组和/或将请求分配给组,所以我很想听听想法或去阅读的地方!