删除此数据框中的某些行后,所有信息都会变为NA,出现了什么问题?

时间:2017-05-17 11:29:57

标签: r

我正在为您在此link中找到的特定数据进行研究复制,数据名为AProrok_AJPS.tab,请点击下载然后你可以选择RData格式。

我想删除特定列中值为1的所有行,因此使用以下代码:

  

df< - data [data $ unknownleader!= 1,]

然而,在此之后,所有数据都变为NA,它基本上都变成了空白。我试图改变整数,因子,类等之间的数据类型,但都导致了同样的问题。我不确定导致此问题的数据文件是什么。有谁可以调查并告诉我一个可能的方法来解决它?

1 个答案:

答案 0 :(得分:0)

好的,感谢@PaulHiemstra指出问题源于数据集中的NA。然后,基于this thread,我可以提出一个解决方案:

首先将该特定unknownleader列中的所有NA替换为0:

  

df $ unknownleader< - replace(df $ unknownleader,is.na(df $ unknownleader),0)

然后按正常方式继续删除问题中提到的行:

  

df< - df [df $ unknownleader == 0,]

请注意,由于unknownleader变量恰好是二项式,因此将NA替换为0仍然有意义。对于其他数据集,可能需要进行一些适当的调整。