嗨,我是Python和美味汤的新手。我试图只从表格的某个部分获取文本。但似乎findAll的结果不是BeautifulSoup类型,我可以再次运行findAll。
select = soup.find('table',{'id':"tp_section_1"})
print "got the right table"
tissues = select.findAll('td',{"class":re.compile("tissue[10]")})
print "got the right cells, now I'd like to get just the text"
tissueText = tissues.findAll(text = True)
最终的行错误,带有TypeError。我似乎能够在查找结果上运行findAll但在后续结果上不能查找findAll。是因为我需要按照元素做这个吗?
作为参考,组织的内容,在最后一行之前看起来像这样,我正在尝试提取诸如“肾上腺”之类的文本:
<td valign="top" height="15" class="tissue1" nowrap>
<a class="tissue_link" href="normal_unit.php?antibody_id=20769&mainannotation_id=2065466">Adrenal gland</a> </td>
答案 0 :(得分:2)
是的,你需要在元素方面做到这一点。 find
返回单个元素。 findAll
返回一个列表,即使该列表只包含一个项目。