我有一个CSV文件,其中一列(应该是一个数字)有一个符号" |"附加到数字的末尾是错误的。我想删除它。
数据集如下所示:
gender age probability|
M 51 0.4567|
F 38 0.6789|
如您所见,probability
列附加了|
如何删除R中整个列的|
答案 0 :(得分:3)
由于不需要的符号位于最后一列,因此您可以在从文件中读取数据时使用comment.char
来删除它。这样,就不需要对柱进行进一步的操纵和强制。这是read.csv()
。
read.csv("x.csv", comment.char = "|")
# gender age probability
# 1 M 51 0.4567
# 2 F 38 0.6789
如果相关列不是文件中的最后一列,请使用系统命令尝试fread()
。这将删除所有|
,无论它们在文件中的位置。
data.table::fread("cat x.csv | tr -d '|'") ## system dependent
# gender age probability
# 1: M 51 0.4567
# 2: F 38 0.6789
使用
创建文件"x.csv"
的位置
writeLines("gender,age,probability|
M,51,0.4567|
F,38,0.6789|", "x.csv")
请注意,我将其设置为csv,因为您声明自己拥有csv文件。