我有2个.dat文件:
YCSB Client 0.1
Command line: -db com.yahoo.ycsb.db.MongoDbClient -s -P /home/james/YCSB/workloads/workloada -p mongodb.url=mongodb://192.168.0.8:27017 -p mongodb.database=ycsb -p recordcount=100 -load
new database url = 192.168.0.8:27017/ycsb
mongo connection created with 192.168.0.8:27017/ycsb
[OVERALL], RunTime(ms), 828.0
[OVERALL], Throughput(ops/sec), 120.77294685990339
[INSERT], Operations, 100
[INSERT], AverageLatency(us), 4279.99
[INSERT], MinLatency(us), 588
[INSERT], MaxLatency(us), 262990
和
YCSB Client 0.1
Command line: -db com.yahoo.ycsb.db.JdbcDBClient -s -P /home/james/YCSB/workloads/workloada -p db.url=jdbc:mysql://192.168.0.8:3306/ycsb -p db.user=root -p db.passwd=root -p recordcount=2001 -load
Adding shard node URL: jdbc:mysql://192.168.0.8:3306/ycsb
Using 1 shards
[OVERALL], RunTime(ms), 3359.0
[OVERALL], Throughput(ops/sec), 595.7130098243525
[INSERT], Operations, 2001
[INSERT], AverageLatency(us), 1259.888055972014
[INSERT], MinLatency(us), 401
[INSERT], MaxLatency(us), 34779
我正在编写一个可以在它们上面使用的脚本,并根据它所使用的文件收集值:
cat 100.dat | head | egrep -w 'Operations|Throughput' | cut -f3 -d' ' | sed 'N;s/\n/ /' | awk ' { t = $1; $1 = $2; $2 = t; print; } '
返回:100 120.77294685990339
我需要第3列,其中包含mongodb
或mysql
。所以我需要一个awk或sed管道,它将搜索任一字符串并将其插入第3列。
所需的输出如下所示:100 120.77294685990339 mysql
答案 0 :(得分:2)
我认为你应该在awk的一次调用中完成整个过程。关键是要更改字段分隔符:
awk -F'[,=]|://' '/^Command/{db=$2}/Operations/{o=$3}/Throughput/{t=$3}END{print o,t,db}' file
字段分隔符设置为,
,=
或://
。您感兴趣的文件部分将保存到变量中,并在文件处理完毕后打印出来。
您可以在END
匹配时进行打印,而不是使用/Operations/
块:
awk -F'[,=]|://' '/^Command/{db=$2}/Operations/{print $3,t,db}/Throughput/{t=$3}' file
当然,这假设将按照两个示例中指定的顺序找到三行。