我阅读了大量文章,但找不到任何真正相关的内容。我保证 :) 这是 BS4 和 python 2.7.3 下的 lxml 解析器。
我有这个:
self.chaptername = self.soup.find_all('center h3 b')
在我的 html 中
<center><h3><b>Chapter 34</b></h3></center>
我希望得到 ["Chapter 34"] 的结果,但结果集为空。
如果我查找 'b',我会得到所有粗体文本的结果集,(带有属性)。
如果我寻找'h3 b',我会得到一个空的结果集。
我应该能够查找 <center><h3><b>
嵌套结构,还是我使用 BS4 错误?
谢谢, 埃德