Question

请考虑下表：

partyId PartyName   AttributeId
------- ----------  -----------
200167  Customer1   6444
200167  Customer1   6443
200167  Customer1   6442
200112  Customer2   6443
200133  Customer3   6443
200133  Customer3   6442
200155  Customer4   6449
200155  Customer4   6442

Customer1具有一组与之关联的AttributeId。我将其称为Customer1的属性集。客户2和3的属性集完全在客户1的属性集中。但是，客户4的属性之一不在客户1的属性集中（attributeId 6449）。我正在尝试编写一个SQL查询，该查询将产生一方的唯一列表，其中该方的整个属性集在customer1的属性集中，并且不包括其整个集不在customer1的属性集中的所有客户。在此示例中，结果应为：

partyId PartyName  
------- ----------  
200112  Customer2
200133  Customer3

Answer 1

以下内容使用汇总并计算与客户1匹配的给定客户的属性数：

df2 = df['T2'].values

df2 = df2 [~np.isnan(df2 )].tolist()

plt.hist(df2 , bins='auto', range=(0,100))
plt.show()

查找所有实体的所有属性值都在另一个实体的属性值之内的所有实体

1 个答案: