标签: java html xml extraction
我首先将xml文件转换为字符串,然后尝试在文件中搜索特定标记。但是,字符串文件非常长(大约15亿个字符),因此搜索通常需要几分钟来计算有多少标题。有一个更好的方法吗?或者是用于提取数据的set方法。
答案 0 :(得分:0)
不要将XML转换为字符串。
解析XML并使用XPATH(XML中的标记地址)提取所需数据 有关详细信息,请参阅this site