Question

我的代码正在寻找包含＆＃39; i.imgur.com /＆＃39;的链接。如何让它搜索＆＃39; i.imgur.com /＆＃39;和＆＃39; imgur.com /＆＃39; ？。这是代码：

import praw
from urllib import urlopen

def sub(path):
yy = r.get_subreddit(path).get_hot(limit = 10)
tt = urlopen('http://www.reddit.com/r/' + path + '/').read()
search = re.findall('http://i.imgur.com/\w+.\w+', tt)

Answer 1

我猜你正在寻找你在这个正则表达式中拥有它们的字面时期，所以我逃脱了它们。此外，在python中定义正则表达式时应使用原始字符串（字符串文字前面的'r'）。您可以将正则表达式的一部分包含在parens中，然后使用问号进行处理：

re.findall(r'http://(i\.)?imgur\.com/\w+\.\w+', tt)

在python中的Findall方法

1 个答案: