StringTokenizer中的多个字符串分隔符

时间:2015-04-09 01:20:39

标签: java stringtokenizer

我正在标记一个HTML块,它必须被这些整个标记字符串拆分:

<dd>
</dd>
<dt>
</dt>

我无法指定

StringTokenizer st = new StringTokenizer(block,"<dt></dt><dd></dd>");
st.nextToken();

这些不是字符集合,它是整个字符串的集合。是否有一种优雅的方式来标记这个?

1 个答案:

答案 0 :(得分:2)

来自JavaDoc

  

StringTokenizer是为保持兼容性而保留的旧类   原因虽然在新代码中不鼓励使用它。建议   任何寻求此功能的人都使用String的split方法   或者改为java.util.regex包。

因此,如果您有String block包含要标记的数据。做点什么

String[] tokens = block.split("(<dd>)|(</dd>)|(<dt>)|(</dt>)");

然后你的标记将成为数组tokens

中的元素