从R

时间:2017-11-07 17:08:15

标签: r csv character

我有一个CSV文件,其中包含我想要使用R删除的特殊字符,因此我可以执行字数统计。

我的意思是特殊字符; ! “£$%^& *()-_ + = [] {}:;'@#〜?。,>< \ |

我在网上看过一些教程,但我不确定要遵循哪一个。请有人建议(带代码),如何删除这些字符。

MyData <-read.csv(file="F:\\All.csv", header=TRUE, sep="," 
MyData

Picture of CSV file with special characters I want to remove

2 个答案:

答案 0 :(得分:0)

您可以使用正则表达式仅保留数字和字母

library(stringr)

m = "ll#$@$!@hjgds fsd f#!#!@"

paste(unlist(str_extract_all(m, '[0-9a-zA-Z ]+')),collapse = '')

答案 1 :(得分:0)

您可以尝试使用以下示例在导入期间将它们视为NA值:

read.csv(file=file="F:\\All.csv", header=TRUE, na.strings=c("!","$") )