在Java中分别从xml文件中提取标题和段落

时间:2015-07-24 08:36:55

标签: java html xml extraction

我首先将xml文件转换为字符串,然后尝试在文件中搜索特定标记。但是,字符串文件非常长(大约15亿个字符),因此搜索通常需要几分钟来计算有多少标题。有一个更好的方法吗?或者是用于提取数据的set方法。

1 个答案:

答案 0 :(得分:0)

不要将XML转换为字符串。

解析XML并使用XPATH(XML中的标记地址)提取所需数据 有关详细信息,请参阅this site