我想知道 R 如何处理变量的空值。我的意思是:我有一个带有两个值的变量:1(发生一种行为)0(不发生行为)。但是在我的表中,相同的数据丢失了,因为我看不到行为,所以有一些空缺。如果我使用这个变量,我可以毫无问题地使用它,或者在工作之前,我必须得到空白数据并且只保留已知变量?
答案 0 :(得分:1)
这实际上取决于您想要对数据做什么。在R中,您通常会使用NA
来查找丢失的数据。有些功能可以解决这个问题,例如:
mean(c(1, NA))
# [1] NA
mean(c(1, NA), na.rm = TRUE)
# [1] 1
但在其他情况下,您可能需要在执行分析之前消除缺失值,例如使用subset
函数。