Question

我有以下表格的数据：

num1    This is a string
num2    This is another string

我想限制在第一个标签之后的所有字符串的长度。这样长度（字符串）<4。因此，我得到的输出是：

num1    This is a string
num2    This is another

我可以使用python来做到这一点。但我试图找到一个等价的Linux来实现同样的目标。

Answer 1

在bash中，您可以使用以下命令限制字符串，在本例中，从索引0到索引17。

$ var="this is a another string"

$ echo ${var:0:17}

this is a another

Answer 2

使用awk，按列：

$ awk '{print $1, $2, $3, $4}' file

或sed：

sed -r 's@^(\S+\s+\S+\s+\S+\s+\S+).*@\1@' file

或使用cut的长度：

$ cut -c 1-23 file

Answer 3

如果您要截断字边界上的字符串，可以将fold与-s选项一起使用：

awk -F"\t" '{
    printf "%s\t", $1; system(sprintf("fold -sw 17 <<< \"%s\" | sed q", $2))
}'

缺点是fold并且需要为每一行调用sed（sed q与tail -n1相同）。