htmlunit引用元素

时间:2017-06-28 14:36:05

标签: java htmlunit

我想以编程方式在网页上发布点击,然后从网站下载CSV文件。我正在尝试用HtmlUnit库实现这个逻辑。我正在尝试使用的代码:

HtmlPage historicalDataHtmlPage = webClient.getPage("https://finance.yahoo.com/quote/GOOG/history?p=GOOG");
                HtmlPage downloadHtmlPage = historicalDataHtmlPage.getAnchorByText("Download Data").click();

HtmlUnit似乎在找到这个特定元素时遇到了问题(不知道为什么 - 我在其他网站上测试了这个解决方案,它似乎通过文本找到了锚点)。

您能告诉我如何解决此错误或如何以其他任何方式参考下载数据元素?

谢谢。

2 个答案:

答案 0 :(得分:0)

请浏览@pvg提及的链接,并根据指南修改您的问题。

话虽如此,您是否尝试使用getAnchors()返回列表List<HtmlAnchor>并查看您想要的标记内的文本内容。也许还有其他元素与“下载数据”的文本假设不符。

会将此作为评论发布,但缺乏声誉。

答案 1 :(得分:0)

看起来页面以最少的内容开头,稍后通过执行一些后台请求为您添加锚点。 尝试等待几秒钟,然后再开始搜索锚点。 另外,最好使用Page.asXML()来了解页面的当前状态(例如,等待之前和之后看看是否有变化。