标签: file-type fileparsing
假设您开始查看XML文件,您可以解析该文件并确认它实际上是XML文件。生活很美好。
然后有人在文件中的某处删除了>,这有效地使文件成为解析器立场中格式错误的XML。就其而言,该文件不再是正确形成的XML文件。
>
有没有办法可以确认该文件实际上仍然是XML文件,虽然格式不正确?
问题超出了XML(显然)。如何得出文件“某某类型可能”的结论,而不是“我无法解析它,因此肯定不是某种类型”?