在python中的Findall方法

时间:2015-01-22 19:34:10

标签: python regex findall

我的代码正在寻找包含' i.imgur.com /'的链接。如何让它搜索' i.imgur.com /'和' imgur.com /' ?。这是代码:

import praw
from urllib import urlopen

def sub(path):
yy = r.get_subreddit(path).get_hot(limit = 10)
tt = urlopen('http://www.reddit.com/r/' + path + '/').read()
search = re.findall('http://i.imgur.com/\w+.\w+', tt)

1 个答案:

答案 0 :(得分:1)

我猜你正在寻找你在这个正则表达式中拥有它们的字面时期,所以我逃脱了它们。此外,在python中定义正则表达式时应使用原始字符串(字符串文字前面的'r')。您可以将正则表达式的一部分包含在parens中,然后使用问号进行处理:

re.findall(r'http://(i\.)?imgur\.com/\w+\.\w+', tt)