如何使用Google表格IMPORTXML()使用Xpath标识此节点

时间:2019-11-06 02:46:27

标签: web-scraping google-sheets google-sheets-api google-sheets-formula

我正在尝试使用Google表格中的IMPORTXML()从特定节点at this URL提取数据。我要定位的节点如下所示。

<div data-elm-id="asset_2820933_address" class="styles__address-container--2l39p styles__u-mr-1--3qZyj">
  <h4 data-elm-id="asset_2820933_address_content_1" class="styles__asset-font-big--vQU7K">
    246 LOWER VIEW ROAD
  </h4>
  <label data-elm-id="asset_2820933_address_content_2" class="styles__asset-font-small--2JgrX">
    Strasburg, VA 22657, Warren County
  </label>
</div>

我的目标是提取代表地址的两个字符串。

  

246 LOWER VIEW ROAD
  沃伦县Strasburg,VA 22657,沃伦县

但是,当我这样做时,我会得到一个错误。

我的Xpath如下:

//h4[starts-with(@class,"styles__asset-font-big")]
//label[starts-with(@class,"styles__asset-font-small")]

所以我的完整Google表格公式如下:

  

IMPORTXML(“ https://www.auction.com/residential/VA/active_lt/auction_date_order,resi_sort_v2_st/y_nbs/bank-owned,newly-foreclosed,foreclosures_at/”,'// h4 [starts-with(@class,“ styles__asset-font-big”)] | // label [starts-with(@class,“ styles__asset-font -small“)]')

这甚至可能吗?还是正在将该网站抓取以某种方式阻止?如果有可能,我在做什么错了?

0 个答案:

没有答案