我希望从足球比赛页面中提取有关红牌和黄牌的数据。匹配页面的一个示例是:http://www.whoscored.com/Matches/667743/MatchReport
正如您在网站上看到的,只有在点击“卡片情况”标签后才能访问卡片数据。因此,当我使用phantomjs保存页面内容时,它不会捕获“卡片情境”选项卡。我知道一个解决方案是模拟鼠标点击,以便生成HTML然后保存,但我该怎么做?
答案 0 :(得分:0)
您应该尝试在单击选项卡时获取它所执行的AJAX请求。例如,当我点击你提到的标签时,它发出了两个AJAX请求:
1)http://www.whoscored.com/optamatchstatfeed/?matchId=667743&stageId=6849&teamId=684&type=14
2)http://www.whoscored.com/optamatchstatfeed/?matchId=667743&stageId=6849&teamId=297&type=14
显然每个团队都有一个。如果您在浏览器中打开上面的任何链接,您会注意到JSON响应格式。像这样:
[[[],[[[3,3,'fk_foul_lost',[6]]]]]]
现在剩下的由你决定了。请享用。 ;)