使用Jsoup检索时间标记

时间:2015-04-26 10:32:44

标签: java jsoup

这是我的Html:

<div id="trestleLifts">
            <header class="tableHeader">
                <time>as of 4/23/15 @5:18 AM MST</time>
                <h2>Lifts</h2>
            </header>

我需要时间标签,但无法解决它。

我尝试使用此代码,但应用程序崩溃

  Document docw = Jsoup.connect(url).get();
  Element doc = docw.getElementById("header.tableHeader");
            Elements h1=doc.getElementsByTag("time");
            String tit = h1.text();

1 个答案:

答案 0 :(得分:3)

Element doc = docw.getElementById("header.tableHeader");

没有多大意义,因为没有id="header.tableHeader"属性的标记。

如果您想选择select,则可能需要使用<header class="tableHeader">

Elements doc = docw.select("header.tableHeader");

您可以使用

选择time标记
Elements h1= doc.select("time");

根据您在其中包含要解析的网页地址的评论,此解决方案的问题似乎是<time>是空元素<time></time>,其内容由JavaScript生成。在那种情况下,Jsoup将无法帮助您,因为它是解析器,而不是JS引擎。您将不得不使用不同的工具,如selenium webdriver或HTMLutils。