当我尝试使用Google电子表格中的xPath规则从autoscout24获取所有广告标题时:
//div[@id="listOutput"]//div[@class="headcar"]/a/text()
结果是#NA - 由于xPath查询没有收到任何数据。
但是,当我尝试从页面获取其他元素时,例如使用xPath规则从同一页面中获取“Kryteria wyszukiwania:”:
//li/span
输出正确。
可能是什么问题?
答案 0 :(得分:0)
在Chrome浏览器中查看的HTML源代码 - 即" view-source:http://www.autoscout24.pl/ListGN.aspx?..."不是通过Firebug或Chrome的Inspect Tool,div#listOutput只包含这个:
<div id="listOutput">
<div id="listoutput_part_one">
</div>
<div id="divSuperAdPlaceHolder">
</div>
<div id="listoutput_part_two">
</div>
</div>
源代码确实包含&#34; li / span&#34;,例如:
<li class="breadcrumb-item breadcrumb-first">
<span>Kryteria wyszukiwania:</Span>
</li>
其余元素必须由浏览器运行的一些Javascript代码构建,我怀疑Google Spreadsheet会解释并执行页面中的Javascript。