这是我用来查看数据子集的代码:
active<-clinic[
(clinic$Days.since.injury.physio > 20 & clinic$Days.since.injury.physio < 35)
&(clinic$Days.since.injury.F.U.1 > 27 & clinic$Days.since.injury.F.U.1 < 63)
, ]
我想根据两个标准选择一组科目,然后分析他们的结果。首先,当我注意到na超过整个数据集时,我正在查看描述性数据。
子集似乎导致NA
。我看过几个帖子,包括下面这两个似乎相关的帖子,但我不明白如何应用答案。
为什么子集会导致完整数据集中不存在的na? (我认为其他帖子的答案是另一个变量中有一个na?)
我该如何解决这个问题?
我希望能够从存在的变量中获取值,而不是在缺少值的情况下忽略整行。
谢谢。
答案 0 :(得分:-1)
这是一种解决方法,是对您的#2
的回复查看代码,可以更轻松地对数据进行子集化。试试这个。
检查这是否解决了您的问题。
library(dplyr)
active<- clinic %>%
filter(Days.since.injury.physio>20,
Days.since.injury.physio<35,
Days.since.injury.F.U.1>27,
Days.since.injury.F.U.1<63
)
dplyr在数据的子集化和操作方面确实很奇怪。
%>%
符号链语句在一起,因此您无需使用$
符号。
如果由于某些奇怪的原因,你不喜欢这样,你应该看一下r中的 子集 功能。