使用Python上的正则表达式在网页中搜索字符串?

时间:2014-07-06 09:32:52

标签: python regex python-2.7

我想搜索网页中是否有/[some names]/unfollow。我对正则表达式的经验很少。这就是我现在的工作。

import urllib
import re

page = urllib.urlopen('http://www.domain.com').read()
results = re.findall('/[\w]*/unfollow', page)
for i in results:
    print i

但上面的代码没有打印任何东西。我做错了吗?如果是这样,我真的需要你们的帮助

由于

1 个答案:

答案 0 :(得分:1)

你的findall函数应该是,

results = re.findall(r'\/[^\/]*\/unfollow', page)

它会找到所有/some names/unfollow格式的字符串。

<强>解释

  • \/匹配文字/符号。
  • [^\/]*匹配任何不属于/零次或多次的字符。
  • \/unfollow匹配字符串/unfollow