Question

###原始数据

df1 <- data.frame(a=c(2,2,5,5,7), b=c(1,5,4,7,6))
df2 <- data.frame(a=c(2,2,5,5,7,7), b=c(1,5,4,7,6,3))

当最后两行的a列值不相等时（此处第四行不等于第五行，即5！= 7），我只想对最后一行进行子集化。

#input

#output

> df1
  a b
1 7 6

当后两行的a列值相等时（这里第5行等于第6行，即7 = 7，我想对后两行进行子集化

#input

#output

> df2
  a b
1 7 6
2 7 3

Answer 1

您可以编写一个函数来检查a列的最后两行值：

return_rows <- function(data) {
  n <- nrow(data)
  if(data$a[n] == data$a[n - 1])
      tail(data, 2)
  else tail(data, 1)
}

return_rows(df1)
#  a b
#5 7 6

return_rows(df2)
#  a b
#5 7 6
#6 7 3

Answer 2

尝试一下

library(tidyverse)
df %>% 
  filter(a == last(a))

  a b
5 7 6

  a b
5 7 6
6 7 3

Answer 3

我们可以使用subset中的base R

subset(df1, a == a[length(a)])

如何根据最后两行的值对data.frame进行子集化？

3 个答案: