我有一个数据框,其中包含一个名为" Title"的变量。有电影标题,然后是在括号中发布的那一年。我需要操纵它,以便将年份作为整数放入其自己的列中。我附上了下面数据的图像。这应该使用正则表达式来完成。请注意,有些标题中包含数字,因此正则表达式应使用一年左右的括号作为信号。
数据样本
答案 0 :(得分:0)
使用库str_match
中的stringr
:
library(stringr)
d$Year <- as.numeric(str_match(d$Title, "\\(([0-9]+)\\)")[,2])
答案 1 :(得分:-1)
您可以使用 -
来自“stringr”库的str_extract(mydf $ mycol,pattern =“pattern”)
示例 -
str_extract(“Movie1(1991)”,pattern =“\ d \ d ++”)
“1991”