PowerShell中的XML父子属性和元素

时间:2013-06-28 02:16:02

标签: xml powershell

我有一些XML数据,它们具有很多属性和多个具有相同名称的元素,我想将其展平为CSV文件。数据XML如下所示:

<?xml version="1.0" encoding="utf-8"?>
<SEGMENTS>
    <SEGMENT NAME="webcluster">
        <RESULTPAGE>
            <RESULTSET FIRSTHIT="1" LASTHIT="100" HITS="100" TOTALHITS="100">
                <HIT NO="1" RANK="19000" SITEID="0" MOREHITS="100">
                    <FIELD NAME="rank">19000</FIELD>
                    <FIELD NAME="id">1</FIELD>
                    <FIELD NAME="url">C:\website.com\folder1\file1.txt</FIELD>
                    <FIELD NAME="filename">file1.txt</FIELD>
                    <FIELD NAME="path">https://website.com/folder1/</FIELD>
                </HIT>
                <HIT NO="2" RANK="19000" SITEID="0" MOREHITS="100">
                    <FIELD NAME="rank">19000</FIELD>
                    <FIELD NAME="id">2</FIELD>
                    <FIELD NAME="url">C:\website.com\folder1\file2.txt</FIELD>
                    <FIELD NAME="filename">file2.txt</FIELD>
                    <FIELD NAME="path">https://website.com/folder1/</FIELD>
                </HIT>
                <HIT NO="3" RANK="18999" SITEID="0" MOREHITS="100">
                    <FIELD NAME="rank">18999</FIELD>
                    <FIELD NAME="id">3</FIELD>
                    <FIELD NAME="url">C:\website.com\folder5\file3.txt</FIELD>
                    <FIELD NAME="filename">file3.txt</FIELD>
                    <FIELD NAME="path">C:\website.com\folder\</FIELD>
                </HIT>
            </RESULTSET>
        </RESULTPAGE>
    </SEGMENT>
</SEGMENTS>

我正在尝试迭代它以产生类似这样的东西

HIT    filename    path  
-----  ----------  ------  
1      file1.txt   C:\website.com\folder1\  
2      file2.txt   C:\website.com\folder1\  
3      file3.txt   C:\website.com\folder5\

我的代码是:

[xml]$xml=Get-Content .\xmlfile.xml  
$hits = $xml.segments.segment.resultpage.resultset.hit  
foreach($hit in $hits)  
{  
    foreach($field in $hit.field)  
    {  
        if (field."NAME" -eq 'url')  
        {  
            write-output $hit.no $field."#VALUE"  
        }  
    }  
}  

我一直在收到错误。我可以通过按顺序位置引用它们来访问不同的元素和属性($ hits [0] .field [4])但是我想防止未来的输出,其中FIELD值可能是不同的顺序。

任何人都可以建议我如何完成这项工作?我尝试使用select-XML,发现它更麻烦,但也许这是更优雅的方法。

3 个答案:

答案 0 :(得分:1)

这样的事似乎是这样做的,虽然我不喜欢这样。

[xml]$xml=Get-Content .\xmlfile.xml  
$hits = $xml.segments.segment.resultpage.resultset.hit  
foreach($hit in $hits)  
{  
    $result = new-object PSObject -Property @{ hit = $hit.no; filename = ""; path = ""}

    foreach($field in $hit.field)  
    {  
        if ($field."NAME" -eq 'url')  
        {  
            $result.path = $field."#text"
        }  
        if ($field."NAME" -eq 'filename')
        {
            $result.filename = $field."#text"
        }
    }  
    write-output $result
}  

或者,只需抓取所有字段,然后选择相关:

[xml]$xml=Get-Content .\xmlfile.xml  
$hits = $xml.segments.segment.resultpage.resultset.hit  
foreach($hit in $hits)  
{  
    $result = new-object PSObject -Property @{ hit = $hit.no }
    $hit.field | % { Add-Member -InputObject $result -MemberType NoteProperty -Name $_."NAME" -Value $_."#text"}  
    $result | select hit,url,filename | write-output
}  

答案 1 :(得分:0)

尝试这样的事情:

Select-Xml -Xml $xml -XPath '//HIT' | Foreach {
    $num=$_.Node.NO
    $filenameAttr = $_.Node.Field | where {$_.Name -eq 'filename'}
    $pathAttr = $_.Node.Field | where {$_.Name -eq 'path'}
    new-object psobject -Property ([ordered]@{HIT=$num; filename = $filenameAttr.InnerText; path = $pathAttr.InnerText})
}

答案 2 :(得分:0)

结合方法。选择允许按特定顺序获取字段。

[xml]$xml=Get-Content .\xmlfile.xml  
$hits = $xml.segments.segment.resultpage.resultset.hit  
foreach($hit in $hits)  
{  
    $r = @{hit = $hit.no; url = "N/A";filename="N/A"}
    $hit.field | % { $r[$_."NAME"] = $_."#text" }  
    New-Object PSObject -Property $r | Select hit,url,filename
}