我正在尝试使用带有XPath的Google Spreadsheet进行网页抓取。但是,页面需要几秒钟才能加载。
这是加载前返回的XML:
<div class=”game_list”>
<div class=”loading”>
<p class=”msg”>Please wait, the result is being loaded…</p>
这是加载后的XML:
<div class=”game_list”>
<div id=”game1”>…</div>
<div id=”game2”>…</div>
<div id=”game3”>…</div>
问题是使用ImportXML只能导入第一个XML。所以我无法从game_list中抓取详细的游戏信息。任何人都可以帮我这个吗?
答案 0 :(得分:1)
似乎页面使用javascript加载数据 - 然后你有问题。要获得这些数据,您需要模拟浏览器并运行javascript的工具 - 如Selenium
- 或者您必须分析javascript代码(加载该数据)并找到加载数据的直接URL。