我有一个数据框(最初来自CSV文件),其中包含NAME和YEAR列。我从前10个条目的数据框中提取了一个样本,如下所示:
sample<-df(1:10,)
我想知道NAME列中值的频率,因此我输入以下内容:
as.data.frame(table(sample$NAME))
这可以正确计算样本中的频率,但也包括“Var1&#39;”中原始数据框中的每个名称。列(所有频率均为0)。
如果我使用unique(样本$ NAME)也会发生同样的事情:它会列出样本中的名称以及原始数据框中的所有名称。
我做错了什么?
答案 0 :(得分:0)
这可能是“NAME”model
列中未使用的level
的情况。我们可以使用factor
或再次致电droplevels
来删除这些未使用的关卡。
factor
或者
as.data.frame(table(droplevels(sample$NAME)))