gawk printf缺少字符

时间:2015-07-02 22:56:22

标签: awk printf gawk

我正在尝试在(g)AWK中创建一个脚本,我想在输出文本文件的开头放置以下EXACT行:

<?xml version="1.0" encoding="UTF-8"?>
<notes version="1">
    <labels>
        <label id="0" color="30DBFF">Custom Label 1</label>
        <label id="1" color="30FF97">Custom Label 2</label>
        <label id="2" color="E1FF80">Custom Label 3</label>
        <label id="3" color="FF9B30">Custom Label 4</label>
        <label id="4" color="FF304E">Custom Label 5</label>
        <label id="5" color="FF30D7">Custom Label 6</label>
        <label id="6" color="303EFF">Custom Label 7</label>
        <label id="7" color="1985FF">Custom Label 8</label>
    </labels>

这一个到最后:

</notes>

到目前为止,这是我的脚本:

BEGIN       {printf("<?xml version="1.0" encoding="UTF-8"?>\n") > "notes.sasi89.xml"}

END         {printf("</notes>") > "notes.sasi89.xml"}

我的问题是它没有按照我喜欢的方式打印,它在输出文件中给出了这个:

<?xml version=1 encoding=-8?>
</notes>

有些字符和引号丢失了,我已经尝试过学习手册,但这对我来说听起来太复杂了,如果有人愿意帮助我或者让我走向正确的方向,我会很高兴。

1 个答案:

答案 0 :(得分:2)

答案是社区维基,以便在信用到期时给予什么信用。

主要问题和解决方案

swstephe中注明comment

  

你需要逃避你的报价:

printf("<?xml version=\"1.0\" encoding=\"UTF-8\"?>\n")

反模式

我认为你的大纲脚本是反模式(实际上是两个反模式)。你有:

BEGIN       {printf("<?xml version="1.0" encoding="UTF-8"?>\n") > "notes.sasi89.xml"}
END         {printf("</notes>") > "notes.sasi89.xml"}

反模式是:

  1. 您重复文件名;你不应该。您最好使用:

    BEGIN {file = "notes.sasi89.xml"
           printf("<?xml version=\"1.0\" encoding=\"UTF-8\"?>\n") > file}
    END   {printf("</notes>") > file}
    
  2. 您不应该首先在awk脚本中进行I / O重定向。您应该让shell执行I / O重定向。

    awk '
    BEGIN {printf("<?xml version=\"1.0\" encoding=\"UTF-8\"?>\n")}
    END   {printf("</notes>")}
    ' > notes.sasi89.xml
    
  3. 有时脚本中的I / O重定向是合适的,但是当您需要输出到多个文件时。当这里看起来很可能只有一个输出文件时,让脚本写入标准输出并让shell执行I / O重定向。它更灵活;您可以更轻松地重命名文件,并通过管道等将输出发送到其他程序,如果您在awk脚本中嵌入了输出文件名,这将非常困难。