我有一个我在R中工作的数据框,我正在尝试检查一个值在其较大的关联组中发生了多少次。具体来说,我正在尝试计算每个特定国家/地区列出的城市数量。
我的数据看起来像这样:
City Country
=========================
New York US
San Francisco US
Los Angeles US
Paris France
Nantes France
Berlin Germany
似乎表格()是要走的路,但我无法弄清楚 - 我怎样才能知道每个国家列出了多少个城市?也就是说,如何找出一列中有多少字段与另一列中的特定值相关联?
编辑:
我希望有一些与
相似的东西3 US
2 France
1 Germany
答案 0 :(得分:3)
我猜你可以试试table
。
table(df$Country)
# France Germany US
# 2 1 3
或使用data.table
library(data.table)
setDT(df)[, .N, by=Country]
# Country N
#1: US 3
#2: France 2
#3: Germany 1
或
library(plyr)
count(df$Country)
# x freq
#1 France 2
#2 Germany 1
#3 US 3