我正在尝试根据县名对数据帧 (n=16070) 进行子集化,该数据帧被编码为字符串变量。数据集如下所示:
county asthma eviction_rate
Alameda 10 1.2
Contra Costa 12 3.2
Orange 9 9.6
San Francisco 1 4.5
我使用了以下代码:
state_file <- subset(state_file, state_file$county != c('Alameda', 'Contra Costa'))
当我运行代码时,我收到以下错误消息:
Warning message:
In state_file$county != c("San Mateo", "San Francisco", "Contra Costa", :
longer object length is not a multiple of shorter object length
我得到的输出包括上述县。
答案 0 :(得分:0)
我们可以使用 %in%
和否定 (!
) 因为 ==
是逐元素比较,仅适用于 ==
的 rhs 上的单个元素或与lhs
subset(state_file, !county %in% c('Alameda', 'Contra Costa'))