我有一个几千兆字节的XML。 XML中没有空格。
所以我写了一些C#代码,分成单个文件(有一些额外的代码来执行一些东西,例如测试时随机化)
using (XmlReader MyReader = XmlReader.Create(@"d:\xml\test.xml"))
{
while (MyReader.Read())
{
switch (MyReader.NodeType)
{
case XmlNodeType.Element:
if (MyReader.Name == "Customer")
{
XElement el = XElement.ReadFrom(MyReader) as XElement;
if (el != null)
{
custNumber = (string)el.Element("CustNumber");
output = @"d:\xml\output\" + custNumber;
File.WriteAllText(output, el.ToString());
}
}
break;
}
}
}
然后我用PowerShell解析生成的文件,主要是因为我发现在服务器上使用它更容易,而规格可以改变,我可以动态更改脚本。
那么......将上面的内容转换为PowerShell的最简单的方法是什么,将[.Net这里]置于一切之前?如果字节在一行上有"<cust"
而在下一行上有"omer>"
,我是否必须逐字节读取?
答案 0 :(得分:9)
这应该与你想要在Powershell中做的非常接近:
$f = [System.Xml.XmlReader]::create("d:\xml\test.xml")
while ($f.read())
{
switch ($f.NodeType)
{
([System.Xml.XmlNodeType]::Element) # Make sure to put this between brackets
{
if ($f.Name -eq "Customer")
{
$e = [System.Xml.Linq.XElement]::ReadFrom($f)
if ($e -ne $null)
{
$custNumber = [string] $e.Element("CustNumber")
$e.ToString() | Out-File -Append -FilePath ("d:\xml\output\"+$e.ToString())
}
}
break
}
}
}