Python re.search与页面源中的变量

时间:2014-09-06 18:47:32

标签: python

我想知道如何搜索从带有。read()的页面加载的数据,并在while语句中搜索该搜索中的变量。这是我写的:

match2 = re.search(r"=profile\.php\?id=" + str(link) + ">(.+?)</a>, <a href=profile\.php\?id=(.+?)>", home)

该页面基本上只列出了所有用户个人资料,并且我试图让每个人都阅读并查看他们的个人资料;非常简单,除了我无法将用户ID设置为link = match2.group(2)的变量才能工作。

1 个答案:

答案 0 :(得分:0)

这不是一个直接的答案,但我强烈建议你看看Beautiful Soup。它是一个HTML解析器,可让您以更加结构化的方式搜索值。在这种情况下,您可以遍历用户配置文件列表中的所有项目,并依次从每个项目中提取所需的信息。