我有一个包含超过10000行和大约20列的数据框。 ID列包含一些具有" _"分隔两个或多个数字/单词等 如何仅对具有" _"的行进行子集化。在ID列中分成单独的数据框?
答案 0 :(得分:2)
str_detect
中的stringr
功能在此处非常有用。既然该软件包已包含在tidyverse
软件包的1.2版本中,则以下代码应该可用:
library(tidyverse)
filtered_df <- df %>%
filter(str_detect(ID, "_"))
这行代码将返回filtered_df
,这是一个基于df
的数据框,仅包含ID
列包含下划线的行。