我正在使用推荐系统的电影镜头数据集。我想从标题栏中分割电影的年份,并将其放入名为Year的新功能中。
import re
title = df3.title
df3.Year = re.findall('[(...)]', title)
标题
Dangerous Minds(1995)
睡眠者(1996)
Cinema Paradiso(Nuovo cinema Paradiso)(1989)
答案 0 :(得分:1)
假设它总是在字符串的末尾:
rgx = re.compile(r"(?:\((\d{4})\))?\s*$")
match = rgx.search(txt)
# group 1 will be None if not matched else eg '1989'
year = match.group(1)
答案 1 :(得分:-1)
expr = re.compile('\((....)\)')
df3.Year = re.findall(expr, title)[-1]