我有一个巨大的文件,其中包含格式错误的xml(主要是未转义的XML字符和CDATA部分)。我正在寻找一个可以修复格式错误的xml的解析器。我使用IntelliJIdea来处理一些较小的xml文件,但是当我给它一个巨大的文件时,IDE会冻结。
是否有可以解决格式错误的XML的不错的工具?
答案 0 :(得分:0)
我相信有人会告诉你回去修复文件的生成器。如果可能,那肯定是最好的事情。
听起来你正计划用手或多或少地做这件事 - 寻找缺陷的模式并修复它们。为此,我使用Notepad ++ - 只是因为我知道它,它将处理真正的大文件,并具有良好的搜索/替换功能,包括正则表达式。但是还有很大的改进空间 - 特别是,如果你是一个regexpert,正则表达式语言有点弱。
在处理这样的文件时,任何试图理解XML不仅仅是色度编码的东西都可能会很慢。
鉴于其整体卓越性,Intellij中的XML支持非常糟糕,性能明智。