请考虑下表:
partyId PartyName AttributeId
------- ---------- -----------
200167 Customer1 6444
200167 Customer1 6443
200167 Customer1 6442
200112 Customer2 6443
200133 Customer3 6443
200133 Customer3 6442
200155 Customer4 6449
200155 Customer4 6442
Customer1具有一组与之关联的AttributeId。我将其称为Customer1的属性集。客户2和3的属性集完全在 客户1的属性集中。但是,客户4的属性之一不在客户1的属性集中(attributeId 6449)。我正在尝试编写一个SQL查询,该查询将产生一方的唯一列表,其中该方的整个属性集在customer1的属性集中,并且不包括其整个集不在customer1的属性集中的所有客户。在此示例中,结果应为:
partyId PartyName
------- ----------
200112 Customer2
200133 Customer3
答案 0 :(得分:1)
以下内容使用汇总并计算与客户1匹配的给定客户的属性数:
df2 = df['T2'].values
df2 = df2 [~np.isnan(df2 )].tolist()
plt.hist(df2 , bins='auto', range=(0,100))
plt.show()