我想在中断 html中获取文字,但是这并没有将段落包含在内部文本中。分部是我唯一的标识符," Msg" 。我怎样才能获得每个元素之一?
<div name="Msg"style="display:block">
<b>
HI!
</b>
2017-11-30-15.28.09.133
<br/>
<b>
123
</b>
abc
<br/>
Your number is 5.
<br/>
</div>
吃水:
HtmlElement msg = (HtmlElement) page.getFirstByXPath("//div[@name='Msg']/text()");
System.err.println(msg.getTextContent());
答案 0 :(得分:1)
正确理解您可能希望代码输出为
您的电话号码是5。
&LT b取代; 123&LT; / B个
&LT b取代; 123&LT; / B个
&LT b取代; HI&LT;!/ B个2017-11-30-15.28.09.133
也许你可能想尝试使用StringTokenizer(下面的代码会在强制执行nextToken()调用时遇到java.util.NoSuchElementException,但希望它会成为一个普遍的想法)
import java.util.StringTokenizer;
..
String sampleStr= "Hello <br/> there <br/>";
StringTokenizer token = new StringTokenizer(sampleStr);
System.out.println(token.nextToken());//You can use .trim()
System.out.println(token.nextToken());
这会有帮助吗?