谷歌电子表格importXML部分工作

时间:2013-07-21 22:54:03

标签: xpath google-sheets

当我尝试使用Google电子表格中的xPath规则从autoscout24获取所有广告标题时:

//div[@id="listOutput"]//div[@class="headcar"]/a/text()

结果是#NA - 由于xPath查询没有收到任何数据。

但是,当我尝试从页面获取其他元素时,例如使用xPath规则从同一页面中获取“Kryteria wyszukiwania:”:

//li/span

输出正确。

可能是什么问题?

1 个答案:

答案 0 :(得分:0)

在Chrome浏览器中查看的HTML源代码 - 即" view-source:http://www.autoscout24.pl/ListGN.aspx?..."不是通过Firebug或Chrome的Inspect Tool,div#listOutput只包含这个:

<div id="listOutput">
    <div id="listoutput_part_one">
    </div>
    <div id="divSuperAdPlaceHolder">
        </div>
    <div id="listoutput_part_two">
    </div>
</div>

源代码确实包含&#34; li / span&#34;,例如:

        <li class="breadcrumb-item breadcrumb-first">
            <span>Kryteria wyszukiwania:</Span>
        </li>

其余元素必须由浏览器运行的一些Javascript代码构建,我怀疑Google Spreadsheet会解释并执行页面中的Javascript。