我正在尝试通过
清理数据集这样我就可以执行一些数据聚合以找到一些见解。
我是R的新手,刚开始学习。 对于我可以采取哪种方法来获得干净和包含数据的任何建议都受到欢迎。
答案 0 :(得分:0)
我不知道这是否会对您有所帮助,因为您的数据无法重现。我为你生成了一些数据。
y <- c("x", 10, 11)
x <- c("t", 20, 15)
然后,我按列绑定这些数据,如下所示:
xy <- cbind(y,x)
然后,你会得到这个:
y x
1 x t
2 10 20
3 11 15
之后,我使用以下代码将其转换为data.frame
:
mydata <- as.data.frame(xy)
之后,您可以使用以下代码逐列选择清理数据:
mydata$y <- as.numeric(as.character(mydata$y))
此代码将替换任何带NA的文本,或者您可以将其设置为0。
输出是这样的:
> mydata
y x
1 NA t
2 10 20
3 11 15