Question

我读过其他文章，例如：

但其中大部分都是简单修复：

他们只有一个匹配的字符串
他们只有一个匹配的部分字符串

所以我在这里寻求帮助。

假设我们有一个这样的示例数据表：

sample = data.table('Feb FY2016', 50)
sample = rbind(sample, list('Mar FY2017', 30))
sample = rbind(sample, list('Feb FY2017', 40))
sample = rbind(sample, list('Mar FY2016', 10))
colnames(sample) = c('month', 'unit')

如何对数据进行子集化，以便我的数据只包含“月”列满足以下要求的行：

有2016年
以'Mar'或'Feb'开头

谢谢！

Answer 1

由于grep返回匹配项的索引，因此它将返回与模式匹配的行，并可用于子集化。

sample[grep('^(Feb|Mar).*2016$', sample$month),]

#         month unit
# 1: Feb FY2016   50
# 2: Mar FY2016   10

正则表达式寻找

行^;
后跟Feb或Mar (Feb|Mar);
任何字符.重复0到多次*;
2016确切地说;
后跟字符串$的结尾。

匹配R中单元格中的两个部分字符串

1 个答案: