R中的子集生成na

时间:2016-02-28 21:30:37

标签: r subset na

这是我用来查看数据子集的代码:

active<-clinic[ 
   (clinic$Days.since.injury.physio > 20 & clinic$Days.since.injury.physio < 35) 
  &(clinic$Days.since.injury.F.U.1 > 27 & clinic$Days.since.injury.F.U.1 < 63)
 , ]

我想根据两个标准选择一组科目,然后分析他们的结果。首先,当我注意到na超过整个数据集时,我正在查看描述性数据。

子集似乎导致NA。我看过几个帖子,包括下面这两个似乎相关的帖子,但我不明白如何应用答案。

  1. 为什么子集会导致完整数据集中不存在的na? (我认为其他帖子的答案是另一个变量中有一个na?)

  2. 我该如何解决这个问题?

  3. 我希望能够从存在的变量中获取值,而不是在缺少值的情况下忽略整行。

    谢谢。

    Subsetting R data frame results in mysterious NA rows

    NA when trying to summarize a subset of data (R)

1 个答案:

答案 0 :(得分:-1)

这是一种解决方法,是对您的#2

的回复

查看代码,可以更轻松地对数据进行子集化。试试这个。

检查这是否解决了您的问题。

library(dplyr)

active<- clinic %>% 
filter(Days.since.injury.physio>20,
       Days.since.injury.physio<35, 
       Days.since.injury.F.U.1>27,
       Days.since.injury.F.U.1<63
      )

dplyr在数据的子集化和操作方面确实很奇怪。

%>%符号链语句在一起,因此您无需使用$符号。

如果由于某些奇怪的原因,你不喜欢这样,你应该看一下r中的 子集 功能。