熊猫数据框过滤器动态列

时间:2020-08-20 13:19:51

标签: pandas

我有熊猫需要处理的多个数据集。

echo f

我要实现的是为这两个表使用通用过滤器,例如使用df.loc [df.DATA1_ID ==“ XXX”],而不必更改任何数据帧上的列名。

我想根据在两个数据框上都可以使用的ID列搜索此“ ID”。

在两个数据帧上运行脚本时的示例行为:

  1. 过滤ID = XXX。结果为DF 1:20200101 XXX123。DF 2:
  2. 过滤ID = AAA。结果将为DF 1:。 DF 2:20200101 AAA 098
  3. 过滤ID = OOO。结果将为DF 1:。 DF 2:

1 个答案:

答案 0 :(得分:1)

我可以想到两种选择:

  1. 将感兴趣的列重命名为一个唯一的名称。根据数据框的数量和列名称的含义,这可能太笨拙了。
  2. 如果您希望访问的列都位于dfs中的同一位置,则可以访问列列表中的第n个列名称。像df.columns[1]之类的东西。
  3. 您可以找到id列:
id_cols = [col for col in df.columns if 'id' in col]