我正在标记一个HTML块,它必须被这些整个标记字符串拆分:
<dd>
</dd>
<dt>
</dt>
我无法指定
StringTokenizer st = new StringTokenizer(block,"<dt></dt><dd></dd>");
st.nextToken();
这些不是字符集合,它是整个字符串的集合。是否有一种优雅的方式来标记这个?
答案 0 :(得分:2)
来自JavaDoc:
StringTokenizer是为保持兼容性而保留的旧类 原因虽然在新代码中不鼓励使用它。建议 任何寻求此功能的人都使用String的split方法 或者改为java.util.regex包。
因此,如果您有String block
包含要标记的数据。做点什么
String[] tokens = block.split("(<dd>)|(</dd>)|(<dt>)|(</dt>)");
然后你的标记将成为数组tokens