尝试使用xpath查询数据

时间:2015-03-23 22:28:43

标签: html xpath google-sheets

我是新手,我正在尝试从网站查询数据并将其导入Google文档电子表格。我使用firebug / firepath来查找xpath,当我将xpath粘贴到cell = importxml(Url,query)时出错。 这是网址:http://www.sportfishingreport.com/pages/boatdetail.php?boat_id=781

Boat        Trip Type     Anglers                    Catch
03-22-2015  Full Day    21    48 Ocean Whitefish, 210 Rockfish, 21 Lingcod

有人可以帮我写xpath,因为firepath告诉我在google docs中写错误的xpath。

先谢谢,杰斯

1 个答案:

答案 0 :(得分:1)

您指定的第二页的源HTML中没有表格(即http://www.channelislandssportfishing.com/fish-counts)。如果有的话,这些表是由Javascript生成的,但IMPORTXML无法找到此内容,因为它在原始源HTML上运行。

但是你从Firepath获得的东西无论如何都是无穷无尽的,因为该工具倾向于返回依赖节点的位置的路径表达式,而不是实际值,ID或名称。如果查看源HTML,包含“Erna B”的HTML部分看起来像

<a href="/erna-b-sportfishing" ><span style="color: #000000;">Erna B</a>

实际上有一个简单的XPath表达式可以选择此内容,因为href属性值是唯一的。要让“Erna B”出现在Google表格的单元格中,请使用

=IMPORTXML("http://www.channelislandssportfishing.com/fish-counts","//a[@href='/erna-b-sportfishing']")

对于所有其他单元格,查找唯一标识节点的类似属性,并将其转换为路径表达式。