我有一个CSV文件,其中包含我想要使用R删除的特殊字符,因此我可以执行字数统计。
我的意思是特殊字符; ! “£$%^& *()-_ + = [] {}:;'@#〜?。,>< \ |
我在网上看过一些教程,但我不确定要遵循哪一个。请有人建议(带代码),如何删除这些字符。
MyData <-read.csv(file="F:\\All.csv", header=TRUE, sep=","
MyData
Picture of CSV file with special characters I want to remove
答案 0 :(得分:0)
您可以使用正则表达式仅保留数字和字母
library(stringr)
m = "ll#$@$!@hjgds fsd f#!#!@"
paste(unlist(str_extract_all(m, '[0-9a-zA-Z ]+')),collapse = '')
答案 1 :(得分:0)
您可以尝试使用以下示例在导入期间将它们视为NA
值:
read.csv(file=file="F:\\All.csv", header=TRUE, na.strings=c("!","$") )