Question

我想搜索网页中是否有/[some names]/unfollow。我对正则表达式的经验很少。这就是我现在的工作。

import urllib
import re

page = urllib.urlopen('http://www.domain.com').read()
results = re.findall('/[\w]*/unfollow', page)
for i in results:
    print i

但上面的代码没有打印任何东西。我做错了吗？如果是这样，我真的需要你们的帮助

由于

Answer 1

你的findall函数应该是，

results = re.findall(r'\/[^\/]*\/unfollow', page)

它会找到所有/some names/unfollow格式的字符串。

<强>解释

\/匹配文字/符号。
[^\/]*匹配任何不属于/零次或多次的字符。
\/unfollow匹配字符串/unfollow

使用Python上的正则表达式在网页中搜索字符串？

1 个答案: