grep匹配文本和数字混合中的特定数字序列

时间:2015-10-23 15:44:31

标签: regex r grepl

我有几个文件类似于" PRISM_ppt_stable_4kmM2 _ ------ _ bil.bil",其中------是年份和月份,如190112.文件日期范围从189501到在R,在Windows 7机器上,我想匹配从192001年到193912年的所有文件。我很确定我想要grepl(),但我无法想象在命令中引用序列的方式。我试过了

my.files[grepl('PRISM.*/1920/.bil$',my.files)]

my.files[grepl('PRISM.*[1][9][2][0].',my.files)]

和其他变体,但只是获取错误消息。我知道[0-9] {4}将匹配任何四个数字序列,但这将匹配所有文件。

1 个答案:

答案 0 :(得分:0)

这就是我要做的事情:

# Reproducible example of file list
library(stringr)
ym <- paste0(1895:1980, str_pad(1:12, 2, pad='0'))
file_list <- paste0("PRISM_ppt_stable_4kmM2_", ym, "_bil.bil")

# Create a list of desired dates and convert to your date format
dates <- seq(as.Date('1920-01-01'), as.Date('1939-12-01'), by='month')
dates <- format(dates, '%Y%m')

# Subset the file list
your_files <- file_list[str_extract(file_list, '[0-9]{6}') %in% dates]