我是新手,我正在尝试从网站查询数据并将其导入Google文档电子表格。我使用firebug / firepath来查找xpath,当我将xpath粘贴到cell = importxml(Url,query)时出错。 这是网址:http://www.sportfishingreport.com/pages/boatdetail.php?boat_id=781
Boat Trip Type Anglers Catch
03-22-2015 Full Day 21 48 Ocean Whitefish, 210 Rockfish, 21 Lingcod
有人可以帮我写xpath,因为firepath告诉我在google docs中写错误的xpath。
先谢谢,杰斯
答案 0 :(得分:1)
您指定的第二页的源HTML中没有表格(即http://www.channelislandssportfishing.com/fish-counts)。如果有的话,这些表是由Javascript生成的,但IMPORTXML
无法找到此内容,因为它在原始源HTML上运行。
但是你从Firepath获得的东西无论如何都是无穷无尽的,因为该工具倾向于返回依赖节点的位置的路径表达式,而不是实际值,ID或名称。如果查看源HTML,包含“Erna B”的HTML部分看起来像
<a href="/erna-b-sportfishing" ><span style="color: #000000;">Erna B</a>
实际上有一个简单的XPath表达式可以选择此内容,因为href
属性值是唯一的。要让“Erna B”出现在Google表格的单元格中,请使用
=IMPORTXML("http://www.channelislandssportfishing.com/fish-counts","//a[@href='/erna-b-sportfishing']")
对于所有其他单元格,查找唯一标识节点的类似属性,并将其转换为路径表达式。