从电影标题栏拆分一年的电影

时间:2017-05-26 04:39:52

标签: python string split

enter image description here

我正在使用推荐系统的电影镜头数据集。我想从标题栏中分割电影的年份,并将其放入名为Year的新功能中。

import re
title = df3.title
df3.Year = re.findall('[(...)]', title)

标题
Dangerous Minds(1995)
睡眠者(1996)
Cinema Paradiso(Nuovo cinema Paradiso)(1989)

2 个答案:

答案 0 :(得分:1)

假设它总是在字符串的末尾:

rgx = re.compile(r"(?:\((\d{4})\))?\s*$")
match = rgx.search(txt)

# group 1 will be None if not matched else eg '1989'
year = match.group(1)

答案 1 :(得分:-1)

expr = re.compile('\((....)\)')
df3.Year = re.findall(expr, title)[-1]