在熊猫中添加唯一列以及过滤器

时间:2019-04-24 11:43:54

标签: python pandas

我想在列中应用过滤器,以及使用熊猫选择不相关列的唯一值。

我想基于ColumnThree中的唯一值获取所有基于应用于ColumnOne和ColumnTwo的过滤器的数据。

df.loc[(df['ColumnOne']==1) & (df['ColumnTwo']=='NW') & (df['ColumnThree'].unique())]

我希望根据过滤器和唯一值显示所有数据的值。

2 个答案:

答案 0 :(得分:0)

这应该可以根据需要工作:df[(df['ColumnOne']==1) & df['ColumnTwo']=='NW')].drop_duplicates(subset=['ColumnThree'], keep=first)

您可以如下更改keep参数:

  • first:除第一个匹配项外,删除重复项。
  • last:删除最后一次出现的重复项。
  • False:删除所有重复项。

文档:link

答案 1 :(得分:0)

该代码进行了以下更改:

  
    
      

newVariable = df [(df ['ColumnOne'] == 1)&(df ['ColumnTwo'] =='NW')]       newVariable.drop_duplicates(subset = ['ColumnThree'])