Question

这什么都不返回？

# Enter your code for "Image Extractor" here.
import re
with open('site.html') as html:
    content = html.read()
    content = str(content)
    print(re.findall(r'<ima?ge?\s+[^>]*?src=["|\']([^["|\']]+)', content))

我认为这与我逃避表达式的反斜杠有关...

Answer 1

[^["|\']]

我不确定你想要做什么。您不能嵌套字符类或使用|进行字符类中的替换。现在的方式，此部分匹配任何不是以下任何一个字符：

[
"
|
'

后跟文字]。如果你希望这是一个单个字符类，它只匹配单引号或双引号，你想要

[^"\']

正则表达式不返回任何内容。为什么？

1 个答案: