我正在学习dplyr将它集成到我的工作流程中,我正在尝试从大型数据集中选择案例。我正在使用我认为简单直接的代码来进行简单的操作,例如这样但它失败了。为什么,逃避我。
对于我做错的任何见解都将不胜感激。
以下是我收到相同错误消息的示例:
City <- c("city1", "city2", "city3", "city4")
var1 <- c(7.5, 9.4, 8.6, 24)
var2 <- c(8, 10, 16, 18)
var3 <- c(1400, 1700, 1800, 3500)
LFA <- data.frame(City, var1, var2, var3)
LFA
数据框:
City var1 var2 var3
1 city1 7.5 8 1400
2 city2 9.4 10 1700
3 city3 8.6 16 1800
4 city4 24.0 18 3500
我试图通过这样做来为较小的区域进行子集化:
StateLFA <- LFA %>%
filter(City=="city1" & City=="city3") %>%
select(City, var1, var2)
我明白了:
[1] City var1 var2
<0 rows> (or 0-length row.names)
答案 0 :(得分:2)
> StateLFA <- LFA %>%
> filter(City=="city1" | City=="city3") %>%
> select(City, var1, var2)
有关运营商的更多信息,请查看http://www.statmethods.net/management/operators.html
对运营商有一个很好的介绍 http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/Boolean.pdf