我正在尝试使用python webscrapping在python中使用漂亮的汤来提取一些信息。这是一节。
<div class="result-value" data-reactid=".0.0.3.0.0.3.$0.1.1">
<span data-reactid=".0.0.3.0.0.3.$0.1.1.0">751</span>
<span class="result-value-unit" data-reactid=".0.0.3.0.0.3.$0.1.1.1">KB</span>
</div
Snap: https://www.dropbox.com/s/d349tb3f22o0wyf/4.png?dl=0
我正在使用的代码就是这个
Sizeofweb=""
try:
Sizeofweb= soup.find('span', {'data-reactid': ".0.0.3.0.0.3.$0.1.1.0"}).text
print Sizeofweb
except StandardError as e:
converted_date="Error was {0}".format(e)
print converted_date
错误
nonetype object has no attribute text
我试过这个但是没有用。我哪里错了?
答案 0 :(得分:1)
此代码适用于我 -
from bs4 import BeautifulSoup
html_str = """
<div class="result-value" data-reactid=".0.0.3.0.0.3.$0.1.1">
<span data-reactid=".0.0.3.0.0.3.$0.1.1.0">751</span>
<span class="result-value-unit" data-reactid=".0.0.3.0.0.3.$0.1.1.1">KB</span>
</div>
"""
soup = BeautifulSoup(html_str,"lxml")
Sizeofweb = soup.find('span', {'data-reactid': ".0.0.3.0.0.3.$0.1.1.0"}).text
print Sizeofweb
输出
751
我注意到的一件事是最后一个div标签关闭了错过近角括号 - &#34;&gt;&#34;
Dunno你是怎么做到的但这对我有用......