这很复杂,我不知道是否有一种有效的方法来进行比较 以下是示例数据:
timestamp value1 value2
1406481868169 ABC 10
1406481868180 ABC 10
1406481868188 ABC 10
1406481868193 ABC 10
1406481868193 EDF 12
1406481868169 EDF 12
1406481868180 EDF 12
1406481868169 XYZ 30
1406481868188 XYZ 20
首先,如果他们有时间戳,我需要将这些项目分组。在此示例数据中,组将是:
---group1-------
1406481868169 ABC 10
1406481868169 EDF 12
1406481868169 XYZ 20
----group2-----
1406481868180 ABC 10
1406481868180 EDF 12
----group3-----
1406481868188 ABC 10
1406481868188 XYZ 30
----group4-----
1406481868193 ABC 10
1406481868193 EDF 12
然后我需要找到匹配组。这意味着两个组具有相同数量的元素,并且元素具有相等的value1和value2。 例如,在示例数据中,group2与group4匹配。 更进一步,我想找到一种方法来找到> xx%匹配组。例如,组1有2个3个元素匹配组2或组4。 有没有有效的方法呢?非常感谢