我有以下列的以下熊猫数据框
code nozzle_no nozzle_var nozzle_1 nozzle_2 nozzle_3 nozzle_4
我想从上面的数据框中获取列名称zzone_1,nozzle_2,nozzle_3,nozzle_4
我正在熊猫后面追随
colnames= sir_df_subset.columns[sir_df_subset.columns.str.contains(pat = 'nozzle_')]
但是,它也包括以下我不想要的zzlezz_no和zzlezz_var。在大熊猫中怎么做?
答案 0 :(得分:3)
您可以在此处使用df.filter
regex
参数:
df.filter(regex='nozzle_\d+')
答案 1 :(得分:2)
.str.contains
有一个regex
标志,默认情况下为True,因此您可以输入正则表达式:
colnames= sir_df_subset.columns[sir_df_subset.columns.str.contains(pat = 'nozzle_\d+$')]
但是@ anky_91与df.filter
的答案要好得多。