提取的数据帧选择仍包含来自完整数据帧集的条目

时间:2015-10-10 17:49:08

标签: r

我有一个数据框(最初来自CSV文件),其中包含NAME和YEAR列。我从前10个条目的数据框中提取了一个样本,如下所示:

sample<-df(1:10,)

我想知道NAME列中值的频率,因此我输入以下内容:

as.data.frame(table(sample$NAME))

这可以正确计算样本中的频率,但也包括“Var1&#39;”中原始数据框中的每个名称。列(所有频率均为0)。

如果我使用unique(样本$ NAME)也会发生同样的事情:它会列出样本中的名称以及原始数据框中的所有名称。

我做错了什么?

1 个答案:

答案 0 :(得分:0)

这可能是“NAME”model列中未使用的level的情况。我们可以使用factor或再次致电droplevels来删除这些未使用的关卡。

factor

或者

as.data.frame(table(droplevels(sample$NAME)))