ImportXML:我试图抓取http://www.tripadvisor.in/Hotels-g297615-c2-Gurgaon_Haryana-Hotels.html。我需要以下字段 - 酒店的名称,URL,地址,城市,Pincode,每个酒店的评论(只是数字),百分比和设施。我想把这一切都放在一个单一的酒店里。谁能帮我吗。
Google Doc链接: https://docs.google.com/spreadsheets/d/1D6X9c9uX7AltxWQ3ln0Pqqzq_CIroCkDxPYr6lv-47k/edit#gid=1666841843
我无法在GoogleDoc中获得上述所有要求。我被困在URL旁边的地址抓取中。
答案 0 :(得分:0)
响应您的评论,您可以将xpath返回的数据限制为使用索引([1]
)的数据(格式化为可读性):
=IMPORTXML(concatenate("http://www.tripadvisor.in",D2),
"(//span[@class='street-address'])[1]")