使用R清除数据

时间:2017-08-06 00:39:49

标签: r data-cleaning

Hey Stackoverflow社区!我在清理R中的一些数据时遇到了一些麻烦。我的变量有分号。例如,

Age   Job         Marital Education Default Balance Housing Loan Contact Day 
1 58; management  married  tertiary      no  ;2143;     yes   no unknown ;5;
2 44; technician  single secondary      no    ;29;     yes   no unknown ;5;   
3 33; entrepreneur married secondary      no     ;2;     yes  yes unknown ;5;   
4 47;  blue-collar married   unknown      no  ;1506;     yes   no unknown ;5;   
5 33;      unknown  single   unknown      no     ;1;      no   no unknown ;5;   
6 35;   management married  tertiary      no   ;231;     yes   no unknown ;5; 

共有45,211行。我一直在想弄清楚如何删除我的df中的所有分号。

3 个答案:

答案 0 :(得分:3)

您似乎可以使用bootstrap.css一次性清除所有受影响的列:

transform

答案 1 :(得分:1)

REGEX功能有很多选项。其中,gsub会这样做。如果

DF <- gsub(";","",DF)

答案 2 :(得分:1)

如果您已有数据帧,则可能对gsub()函数感兴趣。

所以在你的情况下:

 gsub(';', '', df$age)

正如您所推断的,此函数会从您指定的向量中删除任何字母或符号(此处为分号)。