使用Python从网页中提取图像链接

时间:2017-03-09 06:32:55

标签: python html python-2.7

我找到了这个查询 Extract image links from the webpage using Python

有人可以告诉语法(关于第一个答案)的情况下,图像也可以用数字和小写字母组成吗?

每个图像名称都是由大写字母组成的缩写,所以......

for link in re.findall('http://sports.cbsimg.net/images/nba/logos/30x30/[A-Z]*.png', source):

1 个答案:

答案 0 :(得分:0)

您需要知道正则表达式的工作原理。问题代码中的[A-Z] *表示:“每个带有大写字母的名称,无论大写字母数是多少”。

在这里,您可以找到有关如何使用Regex的python working example2.7的文档。

例如,如果您将[A-Z]*替换为.*,您将获得格式为.png的所有图片。

for link in re.findall('http://sports.cbsimg.net/images/nba/logos/30x30/.*\.png', source):

\.png上的反斜杠逃脱了点,因为否则这可能是每个角色。如果你只需要处理大写/小写字母和数字,你也可以这样做:

for link in re.findall('http://sports.cbsimg.net/images/nba/logos/30x30/\w*\.png', source):

这将允许A-Z + a-z + 0-9 + _

希望这会对你有所帮助。