我有一系列的网址
www.domain.com/calendar.php?month=may.2019
www.domain.com/calendar.php?month=april.2019
www.domain.com/calendar.php?month=march.2019
www.domain.com/calendar.php?month=feb.2019
...
...
...
www.domain.com/calendar.php?month=feb.2007
我想年复一年地提取。
我在寻找什么
2019
2019
...
...
2007
并将它们保存到另一列
这就是我所拥有的:
data["urls"].str.extract('(?<=month=).*$')
答案 0 :(得分:4)
df["urls"].str.extract('(?<=month=).*\.(\d{4})$')
如果您可以确信所有功能都具有相同的模式,那么它们应该可以工作。
split
df["urls"].str.rsplit('.', 1).str[-1]
df["urls"].str[-4:]
答案 1 :(得分:0)