我在数据框中有一个列,其中包含不同类型的文本,例如,如下所示:
Column A Column B Column C
Kuala Lumpur 2 new 7 A
old Jakarta 3 6 C
7 Hong Kong 3 A
Jakarta new 22 2 B
我的目标是提取数据框的所有行,对应于“雅加达”字样的位置。在上述专栏中的某个地方。我认为正则表达式能够找到这个词,但不确定如何将它组合起来通过子集提取所有信息。请注意,我的工作表非常大,所以如果可能的话,更喜欢使用像子集这样的命令而不是循环。所需的输出是:
Column A Column B Column C
old Jakarta 3 6 C
Jakarta new 22 2 B
非常感谢您的帮助
答案 0 :(得分:1)
您可以使用grepl
<强> DATA 强>
df <- data.frame(ColumnA=c("Kuala Lumpur 2 new", "old Jakarta 3", "7 Hong Kong", "Jakarta new 22"),
Columnb=c(7, 6, 3, 2), Columnc=c("A", "C", "A", "B"))
<强> 代码 强>
df[grepl("Jakarta ", df$ColumnA), ]