这是我的Html:
<div id="trestleLifts">
<header class="tableHeader">
<time>as of 4/23/15 @5:18 AM MST</time>
<h2>Lifts</h2>
</header>
我需要时间标签,但无法解决它。
我尝试使用此代码,但应用程序崩溃
Document docw = Jsoup.connect(url).get();
Element doc = docw.getElementById("header.tableHeader");
Elements h1=doc.getElementsByTag("time");
String tit = h1.text();
答案 0 :(得分:3)
Element doc = docw.getElementById("header.tableHeader");
没有多大意义,因为没有id="header.tableHeader"
属性的标记。
如果您想选择select
,则可能需要使用<header class="tableHeader">
。
Elements doc = docw.select("header.tableHeader");
您可以使用
选择time
标记
Elements h1= doc.select("time");
根据您在其中包含要解析的网页地址的评论,此解决方案的问题似乎是<time>
是空元素<time></time>
,其内容由JavaScript生成。在那种情况下,Jsoup将无法帮助您,因为它是解析器,而不是JS引擎。您将不得不使用不同的工具,如selenium webdriver或HTMLutils。