重击:将多行数据集重塑为多列数据集

时间:2019-12-26 17:50:10

标签: bash reshape

假设我有以下数据:

# all the numbers are their own number.  I want to reshape exactly as below
0 a 
1 b
2 c
0 d
1 e
2 f
0 g
1 h
2 i
...

我想重塑数据,使其为:

0 a d g ...
1 b e h ... 
2 c f i ...

无需编写复杂的作品。使用unix / bash工具包可以做到这一点吗?

是的,我可以用一种语言轻松完成此操作。这个想法是不要“只是”这样做。因此,如果存在某种cat X.csv | rs [magic options]解决方案(并且rs或bash reshape命令会很棒,除非它在debian Stretch上不起作用),这就是我想要的。

否则,包含命令或脚本组成的等效答案不在范围内:已经知道,但宁愿没有。

2 个答案:

答案 0 :(得分:1)

使用GNU datamash

$ datamash -s -W -g 1 collapse 2 < file
0       a,d,g
1       b,e,h
2       c,f,i

选项:

  • -s排序
  • -W使用空格(空格或制表符)作为分隔符
  • 第一个字段上的
  • -g 1
  • collapse 2打印第二个字段的逗号分隔值列表

要将制表符和逗号转换为空格字符,请将输出通过管道传递到tr

$ datamash -s -W -g 1 collapse 2 < file | tr '\t,' ' '
0 a d g
1 b e h
2 c f i

答案 1 :(得分:0)

bash版本:

function reshape {
    local index number key
    declare -A result
    while read index number; do
        result[$index]+=" $number"
    done
    for key in "${!result[@]}"; do
        echo "$key${result[$key]}"
    done
}
reshape < input

我们只需要确保输入为Unix格式