我有4000多个条目的这个csv,我正在尝试创建其中一个变量的直方图。由于收集数据的方式,如果数据无法收集该条目,则可能将其编码为句点(。)。我仍然想创建一个直方图,只是忽略那个特定的条目。
最好或最简单的方法是什么?
我试过这样做,以便直方图只使用每个条目的数据,除了那个带有句点的条目
newlist <- data1$var[1:3722]+data1$var[3724:4282]
其中3723是具有期间的条目,但R表示+对因子没有意义。我不确定我是否以正确的方式进行此操作,我的目的是创建一个向量或列表或表格,将上述两个子集连接到一个名为newlist的更大列表中。
答案 0 :(得分:3)
你意识到问题更严重。当R读入数据并看到单独的.
时,它将该列解释为因子(分类变量)。
如果您正在使用read.table
或其中一个,则需要将因子转换回数字变量(这是FAQ 7.10)或重新读取数据,强制它将该列读取为数字调用read.table
的函数然后您可以设置colClasses
参数以指定数字列。
一旦数据列是数字变量,那么负下标或!is.na
将起作用(或某些函数将自动忽略缺失值)。