Question

我有一个包含不同行（事件）的表（.tr文件）。

**Event**     **Time**   **PacketLength**  PacketId
sent             1              100           1
dropped          2              100           1
sent             3              100           2
sent             4.5            100           3
dropped          5              100           2
sent             6              100           4
sent             7              100           5
sent             8              100           6
sent             10             100           7

我想创建一个新表如下，我不知道如何在AWK中使用它。

**SentTime**       **PacketLength        Dropped**
1                         100              Yes
3                         100              Yes     
4.5                       100
6                         100
7                         100
8                         100
10                        100

我有一个简单的代码来查找丢弃或发送的数据包，时间和ID但我不知道如何在我的表中创建一个包含丢弃数据包结果的列。

BEGIN{}
{
    Event = $1;
    Time = $2;
    Packet = $6;
    Node = $10;
    id = $11;
        if (Event=="s" && Node=="1.0.1.2"){
                printf ("%f\t %d\n", $2, $6);
        }
} 
    END {}

Answer 1

我会说...

awk '/sent/{pack[$4]=$2; len[$4]=$3}
     /dropped/{drop[$4]}
     END {print "Sent time", "PacketLength", "Dropped";
         for (p in pack) 
               print pack[p], len[p], ((p in drop)?"yes":"")
     }' file

这会将包存储在pack[]中，长度在len[]中，而在drop[]中删除，以便稍后提取。

测试

$ awk '/sent/{pack[$4]=$2; len[$4]=$3} /dropped/{drop[$4]} END {print "Sent time", "PacketLength", "Dropped"; for (p in pack) print pack[p], len[p], ((p in drop)?"yes":"")}' a
Sent time PacketLength Dropped
1 100 yes
3 100 yes
4.5 100 
6 100 
7 100 
8 100 
10 100

Answer 2

您必须将所有信息保存在数组中，以便在文件末尾对其进行后处理。显然，如果文件很大，这可能会导致内存问题。

    BEGIN  {
            template="#sentTime\t#packetLength\t#dropped";
            }
            {
            print $0; 
            event = $1; 
            time = $2; 
            packet_length = $3;
            packet_id = $4; 
            # save all the info in an array
            packet_info[packet_id] = packet_info[packet_id] "#" packet_length "#" time "#" event;
            }
    END     {
            # traverse the information of the array 
            for( time in packet_info ) 
            {
                print "the time is: " time " = " packet_info[time];
                # for every element in the array (= packet), 
                # the data has this format "#100#1#sent#100#2#dropped"
                split( packet_info[time], info, "#" );
                # info[2] <-- 100
                # info[3] <-- 1
                # info[4] <-- sent
                # info[5] <-- 100
                # info[6] <-- 2
                # info[7] <-- dropped
                line = template; 
                line = gensub( "#sentTime", info[3], "g", line );
                line = gensub( "#packetLength", info[2], "g", line ); 
                if( info[4] == "dropped" ) 
                    line = gensub( "#dropped", "yes", "g", line );
                if( info[7] == "dropped" ) 
                    line = gensub( "#dropped", "yes", "g", line );
                line = gensub( "#dropped", "", "g", line );
                print line; 
            } # for 
            }

用于处理跟踪文件中的数据的Awk脚本

2 个答案:

测试