r - 删除此数据框中的某些行后，所有信息都会变为NA，出现了什么问题？

时间：2017-05-17 11:29:57

标签： r

我正在为您在此link中找到的特定数据进行研究复制，数据名为AProrok_AJPS.tab，请点击下载然后你可以选择RData格式。

我想删除特定列中值为1的所有行，因此使用以下代码：

df＆lt; - data [data $ unknownleader！= 1，]

然而，在此之后，所有数据都变为NA，它基本上都变成了空白。我试图改变整数，因子，类等之间的数据类型，但都导致了同样的问题。我不确定导致此问题的数据文件是什么。有谁可以调查并告诉我一个可能的方法来解决它？

答案 0 :(得分：0)

好的，感谢@PaulHiemstra指出问题源于数据集中的NA。然后，基于this thread，我可以提出一个解决方案：

首先将该特定unknownleader列中的所有NA替换为0：

df $ unknownleader＆lt; - replace（df $ unknownleader，is.na（df $ unknownleader），0）

然后按正常方式继续删除问题中提到的行：

df＆lt; - df [df $ unknownleader == 0，]

请注意，由于unknownleader变量恰好是二项式，因此将NA替换为0仍然有意义。对于其他数据集，可能需要进行一些适当的调整。