gsub替换多行中的变化模式

时间:2017-11-29 11:27:59

标签: r web-scraping gsub stringr

我有一个使用报废数据的数据框(Catcher2)。对于MarketValue列,我只想要每个人的价格,例如40,00 Mill。 €

我曾尝试使用gsub(),但我无法删除所有过去的信息。还有一个问题是玩家之间的日期各​​不相同,因此是否有一个代码可用于贯穿整个数据框而不是每个日期的代码行?

Dataframe Table

2 个答案:

答案 0 :(得分:1)

您可以使用以下代码使用sub功能:

x <- "40,00 Mill. € Last change"
sub("\\€.*", "€", x)
[1] "40,00 Mill. €"

答案 1 :(得分:0)

你可以尝试使用正则表达式使用带有负向lookbehind的美元符号标记其位置并删除其后的所有内容。

Catcher2$MarketValue <- gsub("(?<=\\$).*","", as.character(Catcher2$MarketValue), perl = T)