importXML分析错误

时间:2013-12-24 19:58:17

标签: parsing xpath web-scraping google-sheets stock

我需要在otcmarkets.com上解析一组给定股票的资产负债表数据。我正在尝试使用Google Spreadsheet中的importXML函数,但它并没有为我返回任何数据。 xPath查询未返回任何数据。这是我正在使用的功能:

=importxml("http://www.otcmarkets.com/stock/AAEH/financials","//*[@id=’totalCurrentLiabilities’]")

让我知道我做错了什么,以及是否有更好的方法来解析特定的资产负债表数据。

2 个答案:

答案 0 :(得分:2)

页面内容使用JavaScript加载,而不是在Google Spreadsheets中执行。您无法使用=importxml(...)解析此页面。

现在该怎么办?

  • 询问提供商是否提供API。最有可能他们不想被刮掉。
  • 分析页面逻辑并找到加载数据的JavaScript调用,并自行获取。最有可能的是它采用JSON格式,如果没有外部库,就不容易在Google Spreadsheets中解析。
  • 使用某些环境查询将执行JavaScript调用的数据,例如Selenium。与使用Google Spreadsheets相比,将产生更多编程。

答案 1 :(得分:0)

尝试使用importdata函数:

=IMPORTDATA("http://www.otcmarkets.com/otciq/ajax/EdgarFinancialsController.json?ticker=AAEH&mode=annual")