应用错误收集

在Java中解析XML文档时处理特定行

时间：2014-02-03 22:16:21

标签： java xml parsing wiki

我有一个来自wiktionary的巨大xml文件，我需要解析一个类项目。我只需要从一组200行中提取数据，这些行从395,000行开始。我怎么会只扫描少量的线？行号是否有某种内置属性？

2 个答案:

答案 0 :(得分：1)

如果您的数据中的行边界很重要，那么它就不是真正的XML。接受它是什么，一个面向行的文件，并开始使用面向行的文本工具处理它。使用这些来提取XML（如果可以的话），然后将此XML传递给XML解析器。

答案 1 :(得分：0)

行号没有内置属性。

如果要以编程方式查看第395,000行到395,200行的所有数据，可以通过计算换行符来实现。

文件中的每一行以新行（“\ n”）结尾，因此您可以计算其中的349,999行，然后查看数据，直到您再看到200行。