有没有一种简单的方法可以使用python从网站上删除表格(按下按钮后)?

时间:2020-09-20 20:56:57

标签: python html web-scraping python-requests

我正在尝试从此website上刮下一张桌子。 gamelogs表是典型的格式化html表,但是有一个按钮button to click可以将表转换为更易于解析的csv数组。我想知道是否有一种简单的方法(在python中)通过模拟按钮单击来下载csv数组。我尝试过硒,但是似乎可以打开chrome浏览器(我不想这样做)。必须有一种更简单的方法!

谢谢

杰西

2 个答案:

答案 0 :(得分:0)

来自@ satyaganesh987博客:

import pandas as pd
URL = "https://en.wikipedia.org/wiki/Cricket_World_Cup"
tables = pd.read_html(URL,match="Performance details")
print("There are : ",len(tables)," tables")
print("Take look at table 0")
tables[0]

有关更多信息,请查看博客:Scraping Table Data From Websites— using a single line in Python

答案 1 :(得分:0)

该网站的作者正在使用 Javascript 将表格转换为 CSV 格式。 see snapshot 在这种情况下,Selenium 是一种方法(您不喜欢这种方法),或者只是采用表格的 HTML 版本并在 Python 中编写一个等效的函数,将 HTML 表格转换为 CSV。

他们正在使用 this library

相关问题