Question

搜索了一下，但无法找到符合我问题的帖子说我有这个HTML：

<div id=a>
    <span>junk</span>
    content
</div>

我有没有办法获得内容＆＃34;？
doc.find(id="a").string返回无 doc.find(id="a").text返回＆＃34;垃圾内容＆＃34;

Answer 1

有多种方式：

找到recursive=False的所有文本节点并获取最后一个：
```
div.find_all(text=True, recursive=False)[-1]
```
获取span的元素next sibling：
```
div.span.next_sibling.strip()
```
从.contents获取最后一个元素：
```
div.contents[-1].strip()
```

其中div = doc.find(id="a")。