Python 3-使用lxml模块从网页中提取特定数据

时间:2018-08-23 18:33:31

标签: python-3.x python-3.7

我正在尝试编写Python 3代码(使用lxml模块)以从网页中提取一些特定数据。

该网页中显示的HTML数据示例如下:

<tr>
<td><span class="number blue">xx</span></td>
    <td>001</td>
    <td>002</td>
</tr>

我的Python 3代码:

from lxml import html
import requests

page = requests.get("http://some_website.aspx")
tree = html.fromstring(page.content)

var_1 = tree.xpath('//span[@class="number blue"]/text()')
print(var_1)

我能够提取第一个数据(即xx)并将其存储到“ var_1”中。但是,我还需要提取“数字蓝色”类的标记内的数据,并将其存储。

如果有人可以提供有关此问题的建议,请多加赞赏。

0 个答案:

没有答案