R新手: 我有一个csv文件,其中有4个coloumns“Accountnumber”,“description”,“estimatedprice”,“negotiatedprice”
我想清理说明并删除标记,例如,?!#* [}]}';我该怎么办?
我正在编写以下代码,但输出表不起作用。
positivefiles <- read.csv('E:/Sanj/text/Second/positive files.csv')
sf <-positivefiles
df <- gsub("[?.;!¡¿·,']/", "", sf)
当我这样做时,df存储为值而不是csv文件。
我希望清理后的csv文件包含没有标记的说明。
请帮我解决这个问题 谢谢。
答案 0 :(得分:1)
您需要指定gsub您要修改的sf中的哪一列。
尝试:
df <- sf
df$description <- gsub("[?.;!¡¿·,']/", "", df$description)
您可能需要调整语句以匹配您要删除的正确字符集。
答案 1 :(得分:1)
以防万一有人正在寻找最终代码/遇到类似问题。
positivefiles <- read.csv('E:/Sanj/text/Second/positive files.csv')
sf <-positivefiles
df <- sf
df$DESCRIPTION <- gsub("[[:punct:]]","",df$DESCRIPTION)
write.csv(df,"cool.csv)
字典: Cool.csv是我的最终输出文件,存储在目录
中描述是我的一个列,只需要修改。
谢谢大家的意见。