我想执行此操作并获取title和href属性中的所有文本。代码运行,我确实获得了所有需要的数据,但是我想将输出分配给一个数组,当我尝试分配它时,只是给了我HTML中属性的最后一个实例。
from bs4 import BeautifulSoup
import urllib
r = urllib.urlopen('http://www.genome.jp/kegg-bin/show_pathway?map=hsa05215&show_description=show').read()
soup = BeautifulSoup((r), "lxml")
for area in soup.find_all('area', href=True):
print area['href']
for area in soup.find_all('area', title=True):
print area['title']
如果有帮助,我这样做是因为我稍后会创建一个包含数据的列表。我刚刚开始学习,所以非常感谢额外的解释。
答案 0 :(得分:1)
您需要使用l ist comprehensions:
links = [area['href'] for area in soup.find_all('area', href=True)]
titles = [area['title'] for area in soup.find_all('area', title=True)]