是否可以在beautifulSoup中设置我只能打印其内容中包含<img>
的链接?
目前我的代码如下:
import urllib
import re
import mechanize
from bs4 import BeautifulSoup
import urlparse
url = "http://www.nytimes.com"
htmlcontent = urllib.urlopen(url)
soup = BeautifulSoup(htmlcontent)
for link in soup.find_all('a'):
print link.contents
打印出链接内的所有内容。但我真正的需要是打印内容中包含<img>
个标签的链接,我不知道该怎么做......
欢迎任何帮助
答案 0 :(得分:1)
尝试在链接中找到img
标记:
for link in soup.find_all('a'):
if link.find('img'):
print link