Question

我有2个文件。 file1 的示例值如下：

file2 的示例值如下：

我正在尝试修改 file1 并使用以下值创建 file3 （如您所见， file1的最后一列中的值无关紧要）：

此外，需要修改 file2 ，并使用以下值创建 file4 （ file2 <的最后一列中的值/ em>无关紧要）：

1 0 1 1 2 0 2 1 3 0 3 1 4 0 4 1 5 1 6 0 20 0 21 0 21 1 22 0

创建 file3 和 file4 后，我打算使用 diff 实用程序检查它们的相似性。要生成 file3 和 file4 ，我正在尝试编写awk脚本。但作为awk的初学者，我发现这项任务非常耗时。任何指导都将不胜感激。

Answer 1

我们可以从第一行的$1中捕获值，然后在公式中使用它来计算偏移量。假设最小的$1位于第一行。

awk 'NR==1 { i=$1 } { print $1-i+1,$2 }'

例如，你可以这样做：

awk 'NR==1 { i=$1 } { print $1-i+1,$2 }' file1 > file3
awk 'NR==1 { i=$1 } { print $1-i+1,$2 }' file2 > file4
diff file3 file4

这是我之前的版本之前我注意到你真的在寻找一个偏移量。我原以为你只是想根据$1的变化来改变它。我们可以设置一个变量用于检查行之间的值更改，并仅在$1更改时递增计数器。这假设已分组。

awk 'n!=$1 { i++ } { print i,$2 } { n=$1 }'

例如，你可以这样做：

awk 'n!=$1 { i++ } { print i,$2 } { n=$1 }' file1 > file3
awk 'n!=$1 { i++ } { print i,$2 } { n=$1 }' file2 > file4
diff file3 file4

修改和比较两个文件的相似性

1 个答案: