R数据提取和清理

时间:2018-03-24 17:00:40

标签: r dataframe

我正在尝试通过

清理数据集
  1. 删除包含数字列文本值的行
  2. 将ast.range列拆分为astUpper和astLower列,用于上下范围值。
  3. 这样我就可以执行一些数据聚合以找到一些见解。

    我是R的新手,刚开始学习。 对于我可以采取哪种方法来获得干净和包含数据的任何建议都受到欢迎。

    A snapshot of my data is included

1 个答案:

答案 0 :(得分:0)

我不知道这是否会对您有所帮助,因为您的数据无法重现。我为你生成了一些数据。

 y <- c("x", 10, 11)
 x <- c("t", 20, 15)

然后,我按列绑定这些数据,如下所示:

xy <- cbind(y,x)

然后,你会得到这个:

 y x
1  x t
2 10 20
3 11 15

之后,我使用以下代码将其转换为data.frame

mydata <- as.data.frame(xy)

之后,您可以使用以下代码逐列选择清理数据:

mydata$y <- as.numeric(as.character(mydata$y))

此代码将替换任何带NA的文本,或者您可以将其设置为0。

输出是这样的:

> mydata y x 1 NA t 2 10 20 3 11 15