如何从Pandas的网页中抓取表格?

时间:2019-02-18 02:52:41

标签: python-requests lxml

我是编程方面的新手,我正在尝试从https://www.forbes.com/billionaires/list/获取表格。我发现了很多方法可以做到这一点,但是我尝试了但没有做到。

我尝试使用xpath("//th/a")仅导入标头,因为我看到了源代码,这对我来说很有意义。当我尝试查看元素的text_content时,它显示了我不理解的内容: bound method HtmlMixin.text_content of Element a at 0x7f463c3b9818

import pandas as pd
import requests
import lxml.html as lh
page = requests.get("https://www.forbes.com/billionaires/list/")
html_ele = lh.document_fromstring(page.content)
head = html_ele.xpath("//th/a")
head[1].text_content

如何使用Python获取整个表格?我正在学习,这使我陷入困境。

0 个答案:

没有答案