目标
使用PowerShell 5.1,通过使用Microsoft的System.Xml.XmlReader
根据XML模式对无效的XML文件进行验证,以检测无效的XML文件。我将通过捕获XMLException
引发XML解析错误的XmlReader
来检测无效的XML文件。
注意:我不想使用PowerShell社区扩展Test-Xml
cmdlet。
问题
解析无效的XML文件时,代码行$readerResult = $xmlReader.Read()
不会引发XMLException
参考
Validation Using the XmlSchemaSet
我的XSD
<xs:schema attributeFormDefault="unqualified" elementFormDefault="qualified" xmlns:xs="http://www.w3.org/2001/XMLSchema"
targetNamespace="urn:config-file-schema">
<xs:element name="notes">
<xs:complexType>
<xs:sequence>
<xs:element name="note" maxOccurs="unbounded" minOccurs="0">
<xs:complexType>
<xs:sequence>
<xs:element type="xs:string" name="to"/>
<xs:element name="from">
<xs:complexType>
<xs:simpleContent>
<xs:extension base="xs:string">
<xs:attribute type="xs:byte" name="type" use="optional"/>
</xs:extension>
</xs:simpleContent>
</xs:complexType>
</xs:element>
<xs:element type="xs:string" name="heading"/>
<xs:element type="xs:string" name="body"/>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
我的XML无效(第二行使用虚假元素名称notXXXes
)
<?xml version="1.0" encoding="UTF-8"?>
<notXXXes xmlns="urn:config-file-schema">
<note>
<to>Tove</to>
<from type="1">Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
<note>
<to>Bob</to>
<from type="2">KeyW</from>
<heading>Reminder</heading>
<body>I won't</body>
</note>
</notes>
我的代码
运行时,$readerResult
返回true,表示成功读取了下一个节点。我希望$xmlReader.Read()
抛出XMLException
,因为XML文件内容违反了架构。
cls
$error.clear()
try
{
[System.Xml.Schema.XmlSchemaSet] $schemaSet = New-Object -TypeName System.Xml.Schema.XmlSchemaSet
$schemaSet.Add("urn:config-file-schema","C:\Users\x\Desktop\test.xsd");
[System.Xml.XmlReaderSettings] $readerSettings = New-Object -TypeName System.Xml.XmlReaderSettings
$readerSettings.Schemas = $schemaSet
$readerSettings.ValidationType = [System.Xml.ValidationType]::Schema
$readerSettings.ConformanceLevel = [System.Xml.ConformanceLevel]::Fragment
$readerSettings.IgnoreWhitespace = $true;
$readerSettings.IgnoreComments = $true;
[System.Xml.XmlReader]$xmlReader = [System.Xml.XmlReader]::Create("C:\Users\x\Desktop\test.xml", $readerSettings);
#just to show that Schemas was set up OK
"target namespace: " + $readerSettings.Schemas.Schemas().TargetNamespace
$readerResult = $xmlReader.Read()
"readerResult: " + $readerResult
}
catch
{
"error: " + $error
}
finally
{
$xmlReader.Close()
}
编辑#1
此片段将从文件中读取XML的每一行并显示其元数据
while ($xmlReader.Read())
{
write-console ("Depth:{0,1} Name:{1,-10} NodeType:{2,-15} Value:{3,-30}" -f $xmlReader.Depth, $xmlReader.Name, $xmlReader.NodeType, $xmlReader.Value)
}
答案 0 :(得分:1)
XmlReader
概念的全部要点是它是处理XML的 streaming 方法。这样一来,您就可以访问大型/复杂的XML文档,而不必将整个内容都保存在内存中(并且,如果您使用的是DOM风格的访问,则还需要使用多层额外的内存来引导)。
就内存使用而言,这是有效的,但这确实意味着仅当遇到问题的节点时才报告错误。
这里的第一个Read
读取XML声明-<?xml version="1.0" encoding="UTF-8"?>
-看起来格式正确,不应引起任何错误。如果您需要验证整个文档,则需要完全Read
直到结束。但是,如果这仅是您的 目的,那么我可能会例如您要撤消的Test-Xml
Commandlet。