Question

我有以下列的以下熊猫数据框

 code    nozzle_no     nozzle_var    nozzle_1    nozzle_2   nozzle_3   nozzle_4

我想从上面的数据框中获取列名称zzone_1，nozzle_2，nozzle_3，nozzle_4

我正在熊猫后面追随

 colnames= sir_df_subset.columns[sir_df_subset.columns.str.contains(pat = 'nozzle_')]

但是，它也包括以下我不想要的zzlezz_no和zzlezz_var。在大熊猫中怎么做？

Answer 1

您可以在此处使用df.filter regex参数：

df.filter(regex='nozzle_\d+')

Answer 2

.str.contains有一个regex标志，默认情况下为True，因此您可以输入正则表达式：

colnames= sir_df_subset.columns[sir_df_subset.columns.str.contains(pat = 'nozzle_\d+$')]

但是@ anky_91与df.filter的答案要好得多。