我有一个包含30多列的数据框。我想提取三个特定列与一些参考值匹配的行。例如,col A具有州名,col B具有站点类型,col C具有年度访问者的数量。我想知道前往新泽西州(col A)的首都(col B)的游客人数(col C)。
答案 0 :(得分:2)
怎么样
subset(my_df,A=="New Jersey" & B=="capitol")$C
或
with(my_df,my_df[A=="New Jersey" & B=="capitol","C"])
您应该查看一些介绍性的R材料:例如: http://www.ats.ucla.edu/stat/r/faq/subset_R.htm; http://digitheadslabnotebook.blogspot.ca/2009/07/select-operations-on-r-data-frames.html(谷歌搜索结果"数据框中的选择行")
答案 1 :(得分:1)
使用子集命令非常简单。
subset(data, A=="New Jersey" & B=="capital", select=C)
或使用标准索引
data$C[ data$A=="New Jersey" & data$B=="capital" ]
我强烈建议您阅读basic introduction to R因为这是非常基本的东西。