我有一个带有标签的XML文件。我想这样分割文件。
<?xml version="1.0" encoding="UTF-8"?>
<EMPRMART CREATION_DATE="08/20/2018 18:06:44" REPOSITORY_VERSION="187.96">
<REPOSITORY NAME="REP_DEV" VERSION="187" CODEPAGE="UTF-8" DATABASETYPE="Sybase">
<FOLDER NAME="MC_DEV"
<CONFIG DESCRIPTION ="Default ORDER configuration object" ISDEFAULT ="YES" NAME ="default_ORDER_config" VERSIONNUMBER ="1">
<ATTRIBUTE NAME ="Advanced" VALUE =""/>
<ATTRIBUTE NAME ="Order type" VALUE ="NO"/>
</CONFIG>
<ORDER DESCRIPTION ="" ISVALID ="YES"
<ATTRIBUTE NAME ="Normal" VALUE =""/>
<ATTRIBUTE NAME ="Order type" VALUE ="NO"/>
</ORDER>
<ORDER DESCRIPTION ="" ISVALID ="YES"
<ATTRIBUTE NAME ="Medium" VALUE =""/>
<ATTRIBUTE NAME ="Order type" VALUE ="NO"/>
</ORDER>
<ORDER DESCRIPTION ="" ISVALID ="YES"
<ATTRIBUTE NAME ="Advanced" VALUE =""/>
<ATTRIBUTE NAME ="Order type" VALUE ="NO"/>
</ORDER>
<LOCATION DESCRIPTION ="" ISENABLED ="YES"
</LOCATION>
</FOLDER>
</REPOSITORY>
</EMPRMART>
下面是尝试过的代码。但它会将每一行生成到一个新文件中
awk '
BEGIN { RS = "</ORDER>" }
$0 ~ /[^[:blank:]\n]/ {
printf "%s\n", $0 RS >> FILENAME "_" ++i ".xml"
}
' test.xml
我想单独根据ORDER标记分割此文件,如下所述
File1.xml
<ORDER DESCRIPTION ="" ISVALID ="YES"
<ATTRIBUTE NAME ="Normal" VALUE =""/>
<ATTRIBUTE NAME ="Order type" VALUE ="NO"/>
</ORDER>
File2.xml
<ORDER DESCRIPTION ="" ISVALID ="YES"
<ATTRIBUTE NAME ="Medium" VALUE =""/>
<ATTRIBUTE NAME ="Order type" VALUE ="NO"/>
</ORDER>
File3.xml
<ORDER DESCRIPTION ="" ISVALID ="YES"
<ATTRIBUTE NAME ="Advanced" VALUE =""/>
<ATTRIBUTE NAME ="Order type" VALUE ="NO"/>
</ORDER>
答案 0 :(得分:4)
如果您确实使用gnu awk
,则应该会提供您请求的结果。
awk '/<ORDER>/ {f=1;++a} f {print > "file_"a".xml"} /<\/ORDER>/ {f=0}' file
在作为<ORDER>
,</ORDER>
等文件的一部分中,它将仅打印从file_1.xml
到file_2.xml
的行。
答案 1 :(得分:1)
在每个UNIX机器上的任何外壳中都有任何awk:
awk '/<ORDER/{f=1; out="file_"(++c)".xml"} f{print > out} /<\/ORDER>/{close(out); f=0}' file
它显然很脆弱,因为它只是针对文本进行正则表达式匹配,而不是解析XML,但是它适用于您发布的示例和任何类似的文本。
答案 2 :(得分:0)
要实现您的要求,我不会使用awk,而是使用一个好的XML解析器,例如xmlstarlet或xmlint。这里只有一个未知数,那就是名称为ORDER
的节点总数。我们可以为选择写下一个高级XPath,但是我们要保持简洁:
xmlstarlet sel -t -v 'count(//ORDER)' file.xml
现在您已经有了计数,就可以遍历所有情况并写入文件:
#!/usr/bin/env bash
xmlfile=file.xml
n=$(xmlstarlet sel -t -v 'count(//ORDER)' file.xml)
for i in $(seq 1 $n); do
xmlstarlet sel -t -m "//ORDER[${i}]" -c . $xmlfile > "File${i}.xml"
done