我想把dd里面的东西搞定。 我有这段代码:
import urllib
from bs4 import BeautifulSoup
url = 'http://www.brothersoft.com/windows/mp3_audio/'
pageHtml = urllib.urlopen(url).read()
soup = BeautifulSoup(pageHtml)
for a in soup.select('div.coLeft.cate.mBottom a[href]'):
print "http://www.brothersoft.com"+ a['href']
但是输出给了课堂上的所有内容。我只需要dd内的项目。怎么做到的?
答案 0 :(得分:1)
只需将dd
放在其中:
for a in soup.select('div.coLeft.cate.mBottom dd a[href]'):
# ^^
print "http://www.brothersoft.com"+ a['href']