我有以下表达式
filingReportURL = re.search(r'Archive[\'"]?([^\'" >]+)', utf8line)
哪个匹配以Archive开头的网址,但我遇到了麻烦,因为我希望文件名带有扩展名,但我不知道该扩展名是什么。即必须有文件扩展名I.e.每个案例jpg
或.BMP
,但可能是.xyx123
。我已经尝试将[\.\w+]
添加到最后,但是当我进行搜索时,我总是留下延伸的最后一个字母。有关更好,更清洁的方法的任何想法吗?
由于
答案 0 :(得分:0)
为什么你不能像这样使用简单的比赛?
Archive(.*)/(.*)\.([a-z A-Z 0-9]+)
替换匹配将是grep中的\2.\3