我想搜索网页中是否有/[some names]/unfollow
。我对正则表达式的经验很少。这就是我现在的工作。
import urllib
import re
page = urllib.urlopen('http://www.domain.com').read()
results = re.findall('/[\w]*/unfollow', page)
for i in results:
print i
但上面的代码没有打印任何东西。我做错了吗?如果是这样,我真的需要你们的帮助
由于
答案 0 :(得分:1)
你的findall函数应该是,
results = re.findall(r'\/[^\/]*\/unfollow', page)
它会找到所有/some names/unfollow
格式的字符串。
<强>解释强>
\/
匹配文字/
符号。[^\/]*
匹配任何不属于/
零次或多次的字符。\/unfollow
匹配字符串/unfollow