通过Google电子表格延迟使用ImportXML

时间:2014-07-13 07:37:04

标签: xml xpath web-scraping google-sheets

我正在尝试使用带有XPath的Google Spreadsheet进行网页抓取。但是,页面需要几秒钟才能加载。

这是加载前返回的XML:

<div class=”game_list”>
    <div class=”loading”>
        <p class=”msg”>Please wait, the result is being loaded…</p>

这是加载后的XML:

<div class=”game_list”>
    <div id=”game1”>…</div>
    <div id=”game2”>…</div>
    <div id=”game3”>…</div>

问题是使用ImportXML只能导入第一个XML。所以我无法从game_list中抓取详细的游戏信息。任何人都可以帮我这个吗?

1 个答案:

答案 0 :(得分:1)

似乎页面使用javascript加载数据 - 然后你有问题。要获得这些数据,您需要模拟浏览器并运行javascript的工具 - 如Selenium - 或者您必须分析javascript代码(加载该数据)并找到加载数据的直接URL。