Question

我有一个HTML如下：

<span class="tips yjSt" id="takane">その日はじめ（寄り付き）から現在までで、最も高かった値段</span></dt>
</dl>
</div>
<div class="lineFi clearfix">
<dl class="tseDtl"><dd class="ymuiEditLink mar0">
<strong>189.1</strong><span class="date yjSt">（09:00）</span><span class="icoRealTime" title="リアルタイム"> </span></dd>
<dt class="title">安値<a class="tips alignPos" data-ylk="slk:word;pos:4"

我试图提取189.1

soup = BeautifulSoup(html)
res = soup.find_all("dl", {"class": "ymuiEditLink mar0"})
print (res)

但结果是空列表。

Answer 1

findall中提到的标记应为dd

<强>实施例

html = """<span class="tips yjSt" id="takane">その日はじめ（寄り付き）から現在までで、最も高かった値段</span></dt>
</dl>
</div>
<div class="lineFi clearfix">
<dl class="tseDtl"><dd class="ymuiEditLink mar0">
<strong>189.1</strong><span class="date yjSt">（09:00）</span><span class="icoRealTime" title="リアルタイム"> </span></dd>
<dt class="title">安値<a class="tips alignPos" data-ylk="slk:word;pos:4" """
from bs4 import BeautifulSoup

soup = BeautifulSoup(html, "html.parser")
res = soup.find_all("dd", {"class": "ymuiEditLink mar0"})
print(res[0].strong.text)

<强>输出：

189.1

无法从html汤中获取文本

1 个答案: