Pandas提取子串

时间:2017-11-14 12:40:34

标签: regex pandas

我有一个包含dates的列,可能看起来像2017-10-12。我想创建一个包含day的新列,在我的例子中,它将是两个-之间的数字。我尝试了各种.str.extract()查询,但我似乎无法做到正确。

df['days'] = df['dates'].str.extract('(-*)')

任何提示?

1 个答案:

答案 0 :(得分:4)

使用split并按str[1]选择第二个列表:

df['days'] = df['dates'].str.split('-').str[1]

to_datetime格式参数+ dt.day

df['days'] = pd.to_datetime(df['dates'], format='%Y-%d-%m').dt.day