错误的nonetype对象在通过漂亮的汤4 python报废时没有属性文本

时间:2016-11-28 05:49:01

标签: python python-2.7 web-scraping beautifulsoup bs4

我正在尝试使用python webscrapping在python中使用漂亮的汤来提取一些信息。这是一节。

<div class="result-value" data-reactid=".0.0.3.0.0.3.$0.1.1">
<span data-reactid=".0.0.3.0.0.3.$0.1.1.0">751</span>
<span class="result-value-unit" data-reactid=".0.0.3.0.0.3.$0.1.1.1">KB</span>
</div


Snap: https://www.dropbox.com/s/d349tb3f22o0wyf/4.png?dl=0

我正在使用的代码就是这个

Sizeofweb=""
try:
    Sizeofweb= soup.find('span', {'data-reactid': ".0.0.3.0.0.3.$0.1.1.0"}).text
    print Sizeofweb
except StandardError as e:
    converted_date="Error was {0}".format(e)
    print converted_date

错误

nonetype object has no attribute text

我试过这个但是没有用。我哪里错了?

1 个答案:

答案 0 :(得分:1)

此代码适用于我 -

from bs4 import BeautifulSoup

html_str = """
<div class="result-value" data-reactid=".0.0.3.0.0.3.$0.1.1">
<span data-reactid=".0.0.3.0.0.3.$0.1.1.0">751</span>
<span class="result-value-unit" data-reactid=".0.0.3.0.0.3.$0.1.1.1">KB</span>
</div>
"""

soup = BeautifulSoup(html_str,"lxml")

Sizeofweb = soup.find('span', {'data-reactid': ".0.0.3.0.0.3.$0.1.1.0"}).text

print Sizeofweb

输出

751

我注意到的一件事是最后一个div标签关闭了错过近角括号 - &#34;&gt;&#34;

Dunno你是怎么做到的但这对我有用......