从R中的数据框中的值中删除特定字符

时间:2017-07-10 17:48:11

标签: r regex dataframe rstudio gsub

我是R的新手,我的数据框有一个字符类列,格式如下:

> head(unique(season_advanced_stats$Player))
[1] "alex abrines\\abrinal01"  "quincy acy\\acyqu01"      "steven adams\\adamsst01" 
[4] "arron afflalo\\afflaar01" "alexis ajinca\\ajincal01" "cole aldrich\\aldrico01" 

我试图使用gsub,但Rstudio继续输出" +"每次我输入以下代码表明我还没有完成某件事:

season_advanced_stats$Player = gsub('\', '', season_advanced_stats$Player)

如果有人可以帮我弄清楚如何正确使用gsub,那么只剩下玩家名字,我会很感激!

2 个答案:

答案 0 :(得分:3)

您可以使用

删除反斜杠后的所有内容
 gsub("\\\\.*", "", data/vector)

所以我的例子

v <- c("alex abrines\\abrinal01" , "quincy acy\\acyqu01") 

gsub("\\\\.*", "", v)

输出

[1] "alex abrines" "quincy acy" 

答案 1 :(得分:1)

你需要逃避/。目前,R认为'\', '之后的gsub是一个单独的字符串,因为/实际上是逃避了第一个',让R忽略它直到第一个结束字符串去。它会给你一个+作为最终'的提示,它认为它仍在等待。

season_advanced_stats$Player = gsub('\\', '', season_advanced_stats$Player)

应该工作。

请参阅this question