使用Google表格。 我正在尝试在此页面上获取预计到达时间: https://www.hapag-lloyd.com/en/online-business/tracing/tracing-by-booking.html?blno=HLCUEUR181027806#
将来,我将使用其他blno,因此ETA将根据blno(提单号)而变化。将来,blno将来自专栏。
我使用了标准的网页检查方法来确定所需元素的xpath如下: // * [@@ =“ =” ext-gen156“]
这是ETA日期的XPath,在这种情况下,当您访问页面时为12/4/2018。
然后我用以下命令填充E5: // * [@@ =“ =” ext-gen156“]
然后公式“ = importxml(E4,E5)”给出结果“ N / A”(在F4上)。
如果我将E4更改为 https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada
和 E5至 // * [@@ =“ =” mw-content-text“] / div / table [1] / tbody / tr [1] / td [6] / span / a [1]
它起作用了……它从另一个网站获得了不同的信息。
我怀疑上述第一种情况出现问题的原因是它不是静态页面。也许它仅适用于静态页面。
我试图了解XPath的含义,但这也很令人困惑。如果有人给我指出一个很好的解释,那也将很有价值。例如,以下文档说您应该使用“。”选择当前节点。在我尝试使用XPath的情况下,当前含义是什么?似乎没有道理。
https://www.w3schools.com/xml/xpath_syntax.asp
任何战略指导将不胜感激。我可能会做错一切。我也联系了Hapag-Lyod,以查看他们是否有RSS feed,尽管我也是新手。
那么,对于那些已经做了类似工作的专家来说,解决该项目的可能方向是什么?
我正在倒退。我有一个目标,但我不了解所有技术。我的背景更多是客户端应用程序,因此在Web应用程序方面遇到研究麻烦。希望我足够详细,但如果没有,请让我知道如何改善问题,我将很乐意这样做。
答案 0 :(得分:0)
我们开始使用名为AutoIt的工具。 这将是解决此问题的正确工具。