Question

Hey Stackoverflow社区！我在清理R中的一些数据时遇到了一些麻烦。我的变量有分号。例如，

Age   Job         Marital Education Default Balance Housing Loan Contact Day 
1 58; management  married  tertiary      no  ;2143;     yes   no unknown ;5;
2 44; technician  single secondary      no    ;29;     yes   no unknown ;5;   
3 33; entrepreneur married secondary      no     ;2;     yes  yes unknown ;5;   
4 47;  blue-collar married   unknown      no  ;1506;     yes   no unknown ;5;   
5 33;      unknown  single   unknown      no     ;1;      no   no unknown ;5;   
6 35;   management married  tertiary      no   ;231;     yes   no unknown ;5;

共有45,211行。我一直在想弄清楚如何删除我的df中的所有分号。

Answer 1

您似乎可以使用bootstrap.css一次性清除所有受影响的列：

transform

Answer 2

REGEX功能有很多选项。其中，gsub会这样做。如果

DF <- gsub(";","",DF)

Answer 3

如果您已有数据帧，则可能对gsub（）函数感兴趣。

所以在你的情况下：

 gsub(';', '', df$age)

正如您所推断的，此函数会从您指定的向量中删除任何字母或符号（此处为分号）。

使用R清除数据

3 个答案: