Question

我有一个包含超过10000行和大约20列的数据框。 ID列包含一些具有＆＃34; _＆＃34;分隔两个或多个数字/单词等如何仅对具有＆＃34; _＆＃34;的行进行子集化。在ID列中分成单独的数据框？

Answer 1

str_detect中的stringr功能在此处非常有用。既然该软件包已包含在tidyverse软件包的1.2版本中，则以下代码应该可用：

library(tidyverse)

filtered_df <- df %>%
  filter(str_detect(ID, "_"))

这行代码将返回filtered_df，这是一个基于df的数据框，仅包含ID列包含下划线的行。