有没有办法从另一个网页上的HTML表中提取数据?

时间:2016-07-07 14:07:36

标签: html

我很好奇是否计算机可以读取数据并将其拍摄到计算机程序中,以便您可以使用该数据。例如,如果我可以去ESPN的网站,查看联盟排名并将记录发送到我的代码,我想这是可能的。我知道有些网站有你可以使用的API,但是我会用它的网站不会...

2 个答案:

答案 0 :(得分:0)

我这样做是为了在Python中使用Beautiful Soup(https://www.crummy.com/software/BeautifulSoup/bs4/doc/)实现机器学习目的的数据抓取。它通过抓取页面的html并将其转换为一个对象然后可以使用并搜索某些标签(例如表格标签)来“漂亮地”工作。

答案 1 :(得分:0)

最好的方法是通过网页抓取,如果你不是技术娴熟,这是非常先进的。这将需要比HTML更多的东西。如果你不想建立自己的,可以尝试一下:

http://webscraper.io/