如何在R中管理.csv导入,其中预期的数字列包含非数字数据?

时间:2015-11-05 12:26:11

标签: r csv gps numeric

我有一个GPS位置数据集(x),数据集中偶尔会有NA值。应用read.csv命令时,GPS纬度/长值(以UTM米为单位)将作为因子类导入,每个GPS值作为一个级别。

要转换回数字,我试图使用

print(x$lat, quotes = F) 

命令删除引号。输出似乎缺少引号,但是当我存储它时

x$lat <- print(x$lat, quotes = F)

该列被强制转换为字符串。这是一个很好的第一步,但引号保留在字符串中。通常,我读到应用以下函数通常用于删除非数字数据

x$lat <- x$lat[!is.na(as.numeric(as.character(x$lat)))]

但是,由于保留了引号,因此没有数据完全是“数字”,因此!is.na(...)部分返回完全填充FALSE值的向量,结果向量为{{长度为NA的1}}。

我还复制了这个字符串,试图从我可以制作的字符向量中删除引号,但没有用。

x$lat

我想我可以进入excel并删除x$lat <- gsub("\\'", "", x$lat) 值,但我想学习如何在R中有效地管理数据。 Ť

0 个答案:

没有答案