从实时网站将数据导入Google工作表

时间:2019-12-28 18:52:37

标签: xpath web-scraping google-sheets google-sheets-formula google-sheets-importxml

我想从州政府网站(印度中央邦)导入村庄数据。网站为http://saara.mp.gov.in/saaraweb/PublicReport/frm_PerWiseGirdavariStatus.aspx。在此页面中,该报告显示了中央邦所有地区的情况。我要导入所有村庄数据。我的目标地区是“ 37-सिवनी” 。地区名称在第一栏中,其位置根据所有地区所完成工作的百分比而变化。当我单击“ 37-सिवनी” 时,javascript会向我显示“ 37-सिवनी” 的所有塔希希尔语(城镇)。我的目标城镇是“06-घंसाैर” 的位置也会根据所有城镇的已完成工作百分比而变化。现在,当我单击“ 06-घंसाैर” 时,会显示“ 06-घंसाैर” 的村庄列表以及所需的所需数据。我希望该数据在特定时间自动导入到我的googlesheet中。我尝试了 importhtml importxml ,但是它对我不起作用,因为在URL http://saara.mp.gov.in/saaraweb/PublicReport/frm_PerWiseGirdavariStatus.aspx中不能直接获得数据。做一些知道如何导入单击某些javascript对象后显示的数据。这对我会非常有帮助。 https://docs.google.com/spreadsheets/d/1FfjDh5-z0EIZ5GBOrKElgi3dkRtJX_4BW3imTLUu7ds/edit?usp=sharing在工作表“想要” 中,您可以看到我要导入的数据类型,而在“获取” 工作表中,是我获取的数据尝试使用importhtml函数导入。

1 个答案:

答案 0 :(得分:2)

Google表格不支持剪贴JavaScript内容/元素,因此最好的方法是:

=IMPORTHTML("http://saara.mp.gov.in/saaraweb/PublicReport/frm_PerWiseGirdavariStatus.aspx"; 
 "table"; 1)

0

您可以轻松地通过为这样的给定站点禁用JS来轻松测试可以导入的内容:

0