正则表达式

时间:2017-04-04 18:05:35

标签: r regex

我有一个数据框,其中包含一个名为" Title"的变量。有电影标题,然后是在括号中发布的那一年。我需要操纵它,以便将年份作为整数放入其自己的列中。我附上了下面数据的图像。这应该使用正则表达式来完成。请注意,有些标题中包含数字,因此正则表达式应使用一年左右的括号作为信号。

数据样本

enter image description here

2 个答案:

答案 0 :(得分:0)

使用库str_match中的stringr

library(stringr)
d$Year <- as.numeric(str_match(d$Title, "\\(([0-9]+)\\)")[,2])

答案 1 :(得分:-1)

您可以使用 -

  

str_extract(mydf $ mycol,pattern =“pattern”)

来自“stringr”库的

示例 -

  

str_extract(“Movie1(1991)”,pattern =“\ d \ d ++”)

     

“1991”