Question

我有4000多个条目的这个csv，我正在尝试创建其中一个变量的直方图。由于收集数据的方式，如果数据无法收集该条目，则可能将其编码为句点（。）。我仍然想创建一个直方图，只是忽略那个特定的条目。

最好或最简单的方法是什么？

我试过这样做，以便直方图只使用每个条目的数据，除了那个带有句点的条目

newlist <- data1$var[1:3722]+data1$var[3724:4282]

其中3723是具有期间的条目，但R表示+对因子没有意义。我不确定我是否以正确的方式进行此操作，我的目的是创建一个向量或列表或表格，将上述两个子集连接到一个名为newlist的更大列表中。

Answer 1

你意识到问题更严重。当R读入数据并看到单独的.时，它将该列解释为因子（分类变量）。

如果您正在使用read.table或其中一个，则需要将因子转换回数字变量（这是FAQ 7.10）或重新读取数据，强制它将该列读取为数字调用read.table的函数然后您可以设置colClasses参数以指定数字列。

一旦数据列是数字变量，那么负下标或!is.na将起作用（或某些函数将自动忽略缺失值）。