我正在尝试从此website上刮下一张桌子。 gamelogs表是典型的格式化html表,但是有一个按钮可以将表转换为更易于解析的csv数组。我想知道是否有一种简单的方法(在python中)通过模拟按钮单击来下载csv数组。我尝试过硒,但是似乎可以打开chrome浏览器(我不想这样做)。必须有一种更简单的方法!
谢谢
杰西
答案 0 :(得分:0)
来自@ satyaganesh987博客:
import pandas as pd
URL = "https://en.wikipedia.org/wiki/Cricket_World_Cup"
tables = pd.read_html(URL,match="Performance details")
print("There are : ",len(tables)," tables")
print("Take look at table 0")
tables[0]
有关更多信息,请查看博客:Scraping Table Data From Websites— using a single line in Python
答案 1 :(得分:0)
该网站的作者正在使用 Javascript 将表格转换为 CSV 格式。
在这种情况下,Selenium 是一种方法(您不喜欢这种方法),或者只是采用表格的 HTML 版本并在 Python 中编写一个等效的函数,将 HTML 表格转换为 CSV。
他们正在使用 this library。