HtmlUnit读取<a> tags</a>之间的特定链接信息

时间:2014-06-27 00:18:10

标签: parsing hyperlink html-parsing htmlunit

我使用HtmlUnit连接到网页,我想阅读标签之间的信息。我将演示使用一些代码。让我们假设我有以下链接:

<a href="www.anypage.com"> Hello! </a>

我想阅读介于两者之间的Hello,最好保存到String变量中。这是任务必不可少的代码

// Simulating a Chrome browser
WebClient webClient = new WebClient(BrowserVersion.CHROME); 
loggedIn = webClient.getPage("random-page.com");
HtmlAnchor anchorLink = loggedIn.getAnchorByHref("/private-messages/inbox");

现在,如果我使用anchorLink.toString(),我会从前一个示例中获得<a href="www.anypage.com">,但不会检测标记之间的字符。我已经通过了API,我似乎找不到任何有用的东西。任何解决方法?

1 个答案:

答案 0 :(得分:1)

getTextContent()会成为您想要的吗?