标签: xml scala xml-parsing
我需要解析一个巨大的日志文件(~2M行),几百行关于特定用户的信息。我需要的这些行包含在XML分隔符中,但该文件提供了许多自由文本通知;类似于" 2016-06-08 06:00:00,289 [HSBLink] DEBUG HSBLink_5 - 收到MSG",我不在乎。
我是Scala的新手,但我有Java背景。我想知道我应该走哪条路:以某种方式将整个事物解析为XML,然后忽略大部分内容,或者将其解析为自由文本并在其中搜索我关心的标识符,并附上文本。
谢谢!