我正在尝试编写Python 3代码(使用lxml模块)以从网页中提取一些特定数据。
该网页中显示的HTML数据示例如下:
<tr>
<td><span class="number blue">xx</span></td>
<td>001</td>
<td>002</td>
</tr>
我的Python 3代码:
from lxml import html
import requests
page = requests.get("http://some_website.aspx")
tree = html.fromstring(page.content)
var_1 = tree.xpath('//span[@class="number blue"]/text()')
print(var_1)
我能够提取第一个数据(即xx)并将其存储到“ var_1”中。但是,我还需要提取“数字蓝色”类的标记内的数据,并将其存储。
如果有人可以提供有关此问题的建议,请多加赞赏。