Google docs importXML TripAdvisor

时间:2014-08-09 16:33:49

标签: xml xpath google-sheets google-docs google-docs-api

ImportXML:我试图抓取http://www.tripadvisor.in/Hotels-g297615-c2-Gurgaon_Haryana-Hotels.html。我需要以下字段 - 酒店的名称,URL,地址,城市,Pincode,每个酒店的评论(只是数字),百分比和设施。我想把这一切都放在一个单一的酒店里。谁能帮我吗。

Google Doc链接: https://docs.google.com/spreadsheets/d/1D6X9c9uX7AltxWQ3ln0Pqqzq_CIroCkDxPYr6lv-47k/edit#gid=1666841843

我无法在GoogleDoc中获得上述所有要求。我被困在URL旁边的地址抓取中。

1 个答案:

答案 0 :(得分:0)

响应您的评论,您可以将xpath返回的数据限制为使用索引([1])的数据(格式化为可读性):

=IMPORTXML(concatenate("http://www.tripadvisor.in",D2),
            "(//span[@class='street-address'])[1]")