我正在为您在此link中找到的特定数据进行研究复制,数据名为AProrok_AJPS.tab
,请点击下载然后你可以选择RData格式。
我想删除特定列中值为1的所有行,因此使用以下代码:
然而,在此之后,所有数据都变为NA,它基本上都变成了空白。我试图改变整数,因子,类等之间的数据类型,但都导致了同样的问题。我不确定导致此问题的数据文件是什么。有谁可以调查并告诉我一个可能的方法来解决它?df< - data [data $ unknownleader!= 1,]
答案 0 :(得分:0)
好的,感谢@PaulHiemstra指出问题源于数据集中的NA。然后,基于this thread,我可以提出一个解决方案:
首先将该特定unknownleader
列中的所有NA替换为0:
df $ unknownleader< - replace(df $ unknownleader,is.na(df $ unknownleader),0)
然后按正常方式继续删除问题中提到的行:
df< - df [df $ unknownleader == 0,]
请注意,由于unknownleader
变量恰好是二项式,因此将NA替换为0仍然有意义。对于其他数据集,可能需要进行一些适当的调整。