将网站特定数据导入Google表格

时间:2019-09-06 13:28:36

标签: google-apps-script google-sheets

一段时间以来,我一直在尝试从网站https://www.infogol.net/matches/result/english-premier-league/everton-vs-wolves-2019-09-01/30701成功导入特定数据的方法

在“统计信息”标签的“地图”中,有一个名为Infogol xG的数据,这正是我希望能够为电子表格播放的数据。

我尝试了各种格式的ImporXML和ImportDATA,但从未成功。

我希望您能帮助您通过脚本或公式来查找表格以捕获这些数据,这对于我正在研究足球比赛中踢球定性系统的研究至关重要。

Image

Image Link specifying the data I need

1 个答案:

答案 0 :(得分:0)

这个答案怎么样?在此答案中,使用IMPORTXML。不幸的是,1.54, 2.14的值不能直接从URL的HTML数据中检索。因此,从句子中检索值。请认为这只是几个答案之一。

示例公式:

=SPLIT(REGEXREPLACE(REGEXREPLACE(IMPORTXML(A1,"//div[2]/p[1]/text()[last()]"),"\(\w.+\)|[^\d. ]","")," |. |.$","@"),"@",TRUE,TRUE)

在这种情况下,https://www.infogol.net/matches/result/english-premier-league/everton-vs-wolves-2019-09-01/30701放在单元格“ A1”中。该公式的流程如下。

  1. 使用//div[2]/p[1]/text()[last()]IMPORTXML的xpath从URL检索HTML数据。
  2. 使用REGEXREPLACE从HTML数据中检索值。
  3. 使用REGEXREPLACESPLIT检索所需的值。

结果:

enter image description here

注意:

  • 该公式可用于https://www.infogol.net/matches/result/english-premier-league/everton-vs-wolves-2019-09-01/30701的当前URL。当您想将此用于其他URL和/或更改URL的页面设计时,可能会发生错误。请注意这一点。

参考文献:

如果这不是您想要的方向,我深表歉意。