使用grepl匹配具有一个特定数字的名称

时间:2018-09-21 09:21:22

标签: r grepl

我有一个具有列名和行名的数据,该数据的字符串是从1到100的数字。

我正在使用grepl选择具有特定数字的名称(而忽略字符串)。说我有:

a <- matrix(c(1:16), nrow = 4, byrow = TRUE)
colnames(a) <- c("aaa1", "bbb1", "abc11", "ccc100")
rownames(a) <- c("aaa1", "bbb1", "abc11", "ccc100")

给出矩阵a

       aaa1 bbb1 abc11 ccc100
aaa1      1    2     3      4
bbb1      5    6     7      8
abc11     9   10    11     12
ccc100   13   14    15     16

我想选择包含“ 1”但没有其他内容的行和列。像这样:

     aaa1 bbb1
aaa1    1    2
bbb1    5    6 

但是当我使用时:

a[grepl("1" , rownames(a)) , grepl("1" , colnames(a))]

我再次得到矩阵a。我尝试使用“ ^ 1”,但是它当然找不到与1完全相同的名称。我该怎么办?感谢您的帮助。

1 个答案:

答案 0 :(得分:2)

编辑

问题中的更新数字从1到100,我们只想提取正好为1的行和列。我们可以从行和列名中提取整个数字部分,然后仅过滤那些完全等于1。

library(stringr)
a[str_extract(rownames(a), "[0-9]+") == 1, str_extract(colnames(a), "[0-9]+") == 1]

#     aaa1 bbb1
#aaa1    1    2
#bbb1    5    6

grepl中继续相同的逻辑,我们可以更新正则表达式并在字符串末尾查找字符后跟“ ​​1”

a[grepl("[A-Za-z]1$", rownames(a)), grepl("[A-Za-z]1$", colnames(a))]

#     aaa1 bbb1
#aaa1    1    2
#bbb1    5    6

原始答案

使用“ 1 $”表示以“ 1”结尾的字符串,然后可以对其进行子集化。

a[grepl("1$",rownames(a)), grepl("1$",colnames(a))]

#     aaa1 bbb1
#aaa1    1    2
#bbb1    5    6

等效于

a[endsWith(rownames(a), "1"), endsWith(colnames(a), "1")]

#     aaa1 bbb1
#aaa1    1    2
#bbb1    5    6