将文本文件标记解析为xml - Java

时间:2017-03-09 18:31:29

标签: java xml file parsing

我有一个日志文本文件,包含多个标签,如下所示:

$(document).ready(function() {
  $('div.nav-icon').addClass("nav-icon--x nav-icon--white");
  $('div.header.header--mic').addClass("header--site-nav-expanded");
  $('div.header__site-nav').addClass("header__site-nav--expanded");
  $('div.site-nav').toggleClass("site-nav--hidden");
});

我想解析这个文件,因此我认为因为它看起来像XML我可以将xml(<log level="info" id="12144" ....> <msg> test msg </msg> </log> &gt;)和根(<?xml version="1.0"?)标记添加到文件然后解析它与DOM Parser。

但是目前,我面临着在文件开头添加文本的问题,因为所有可用选项都要覆盖,或者将原始文件复制到临时位置然后添加预期文本,这是不适用的对我来说,因为我正在处理大于100 MB的文件。

<file>

您是否有任何建议在开头添加文本或解析文本文件并提取元素?

谢谢,

2 个答案:

答案 0 :(得分:1)

如果您知道条目的确切模式,如果该模式没有变化那么通过常规提取条目相对容易表达式,例如:

"<log *level=\"([^\"]*)\" *id=\"([^\"])\" *> ..."

答案 1 :(得分:0)

您是否只能将文件的内容设为StringStream或其他任何内容,然后将您的内容添加到开头?之后,您仍然可以解析文档String/Stream无论