无法从html汤中获取文本

时间:2018-04-05 07:17:46

标签: python html beautifulsoup

我有一个HTML如下:

<span class="tips yjSt" id="takane">その日はじめ(寄り付き)から現在までで、最も高かった値段</span></dt>
</dl>
</div>
<div class="lineFi clearfix">
<dl class="tseDtl"><dd class="ymuiEditLink mar0">
<strong>189.1</strong><span class="date yjSt">(09:00)</span><span class="icoRealTime" title="リアルタイム"> </span></dd>
<dt class="title">安値<a class="tips alignPos" data-ylk="slk:word;pos:4" 

我试图提取189.1

soup = BeautifulSoup(html)
res = soup.find_all("dl", {"class": "ymuiEditLink mar0"})
print (res)

但结果是空列表。

1 个答案:

答案 0 :(得分:2)

findall中提到的标记应为dd

<强>实施例

html = """<span class="tips yjSt" id="takane">その日はじめ(寄り付き)から現在までで、最も高かった値段</span></dt>
</dl>
</div>
<div class="lineFi clearfix">
<dl class="tseDtl"><dd class="ymuiEditLink mar0">
<strong>189.1</strong><span class="date yjSt">(09:00)</span><span class="icoRealTime" title="リアルタイム"> </span></dd>
<dt class="title">安値<a class="tips alignPos" data-ylk="slk:word;pos:4" """
from bs4 import BeautifulSoup

soup = BeautifulSoup(html, "html.parser")
res = soup.find_all("dd", {"class": "ymuiEditLink mar0"})
print(res[0].strong.text)

<强>输出:

189.1