通过正则表达式过滤数据框时如何保留某些列

时间:2019-04-28 19:58:03

标签: python pandas dataframe

我正在使用正则表达式通过以下命令对包含tweet_volume的列进行过滤:

tweet_volume_df = df_merged.filter(regex=("tweet_volume.*"))

df_merged中有一个列name。我想在name中加入tweet_volume_df列。

如何单行执行此操作?

2 个答案:

答案 0 :(得分:2)

您可以使用

df.filter(regex=r'(Name|tweet_volume.*)',axis=1)

答案 1 :(得分:0)

您可以使用“ |”在正则表达式中,以匹配名称或tweet_volume。*:

import pandas as pd

data = [list(range(5))]
headers = ['name', 'tweet_volume1', 'tweet_volume2', 'a', 'b']
df_merged = pd.DataFrame(data, columns=headers)

tweet_volume_df = df_merged.filter(regex=("tweet_volume.*|name"))